您的位置:首页 >观察 >

科学家发布新的人类泛基因组参考


(资料图片)

研究人员发布了一个新的高质量参考人类基因组序列集合,从不同人群中捕获了比以前更多的多样性。这项工作由国际人类泛基因组参考联盟领导,该联盟由美国国立卫生研究院下属的国家人类基因组研究所 (NHGRI) 资助。

新的“泛基因组”参考包括47 人的基因组序列,研究人员的目标是到 2024 年年中将这一数字增加到 350 人。由于每个人都携带一对染色体,目前的参考文献实际上包括 94 个不同的基因组序列,目标是在项目完成时达到 700 个不同的基因组序列。

这项工作发表在《自然生物技术》杂志上,是联盟成员发表的几篇论文之一。

基因组是帮助每个生物发育和发挥功能的 DNA 指令集。个体间的基因组序列略有不同。就人类而言,任何两个人的基因组平均超过 99% 是相同的。这些微小的差异造就了每个人的独特性,并可以提供有关他们健康的见解,有助于诊断疾病、预测结果和指导医疗。

为了解这些基因组差异,科学家们创建了参考人类基因组序列以用作“标准”——人类基因组序列的数字合并,可用作比对、组装和研究其他人类基因组序列的比较。

原始参考人类基因组序列已有近 20 年历史,并且随着技术进步和研究人员修复错误并发现人类基因组的更多区域而定期更新。然而,它从根本上限制了它对人类物种多样性的表示,因为它仅包含大约 20 个人的基因组,而且大部分参考序列仅来自一个人。

“每个人都有一个独特的基因组,因此对每个人使用单一参考基因组序列会导致基因组分析的不公平,”NHGRI 校内研究计划计算和统计基因组学分部的高级研究员 Adam Phillippy 博士说,主要研究的共同作者。“例如,对于基因组与参考基因组差异更大的人来说,预测遗传病可能效果不佳。”

当前的参考人类基因组序列存在反映缺失信息的缺口,尤其是在重复且难以阅读的区域。最近的技术进步,例如一次读取更长 DNA 的长读长 DNA 测序,帮助研究人员填补了这些空白,从而创建了第一个完整的人类基因组序列。这个完整的人类基因组序列于去年作为 NIH 资助的端粒到端粒 (T2T) 联盟的一部分发布,并被纳入当前的泛基因组参考。事实上,许多 T2T 研究人员也是人类泛基因组参考联盟的成员。

关键词: