您的位置:首页 >综合经验 >正文

科学家发布新的人类泛基因组参考

摘要 研究人员发布了一个新的高质量参考人类基因组序列集合,从不同人群中捕获了比以前更多的多样性。这项工作由国际人类泛基因组参考联盟领导,

研究人员发布了一个新的高质量参考人类基因组序列集合,从不同人群中捕获了比以前更多的多样性。这项工作由国际人类泛基因组参考联盟领导,该联盟由国立卫生研究院下属的国家人类基因组研究所 (NHGRI) 资助。

新的“泛基因组”参考包括 47 人的基因组序列,研究人员的目标是到 2024 年年中将这一数字增加到 350 人。由于每个人都携带一对染色体,目前的参考文献实际上包括 94 个不同的基因组序列,目标是在项目完成时达到 700 个不同的基因组序列。

这项工作出现在《自然》杂志上,是联盟成员发表的几篇论文之一。

基因组是帮助每个生物发育和发挥功能的 DNA 指令集。个体间的基因组序列略有不同。就人类而言,任何两个人的基因组平均超过 99% 是相同的。这些微小的差异造就了每个人的独特性,并可以提供有关他们健康的见解,有助于诊断疾病、预测结果和指导医疗。

为了理解这些基因组差异,科学家们创建了参考人类基因组序列作为“标准”使用——人类基因组序列的数字合并,可用作比对、组装和研究其他人类基因组序列的比较。

原始参考人类基因组序列已有近 20 年历史,并且随着技术进步和研究人员修复错误并发现人类基因组的更多区域而定期更新。然而,它从根本上限制了它对人类物种多样性的表示,因为它仅包含大约 20 个人的基因组,而且大部分参考序列仅来自一个人。

“每个人都有一个独特的基因组,因此对每个人使用单一参考基因组序列会导致基因组分析的不公平,”NHGRI 校内研究计划计算和统计基因组学分部的高级研究员 Adam Phillippy 博士说,主要研究的共同作者。“例如,对于基因组与参考基因组差异更大的人来说,预测遗传病可能效果不佳。”

当前的参考人类基因组序列存在反映缺失信息的缺口,尤其是在重复且难以阅读的区域。最近的技术进步,例如一次读取更长 DNA 的长读长 DNA 测序,帮助研究人员填补了这些空白,从而创建了第一个完整的人类基因组序列。这个完整的人类基因组序列于去年作为 NIH 资助的端粒到端粒 (T2T) 联盟的一部分发布,并被纳入当前的泛基因组参考。事实上,许多 T2T 研究人员也是人类泛基因组参考联盟的成员。

使用先进的计算技术比对各种基因组序列,研究人员构建了一个新的人类泛基因组参考,泛基因组中的每个组件都覆盖了超过 99% 的预期序列,准确率超过 99%。它还建立在之前的参考基因组序列的基础上,在 DNA 中添加了超过 1 亿个新碱基或“字母”。虽然以前的参考基因组序列是单一的和线性的,但新的泛基因组同时代表了人类基因组序列的许多不同版本。这为研究人员使用泛基因组分析其他人类基因组序列提供了更广泛的选择。

“通过使用泛基因组参考,我们可以更准确地识别更大的基因组变异,称为结构变异,”博士 Mobin Asri 说。加州大学圣克鲁斯分校的学生和该论文的共同第一作者。“我们能够找到使用以前依赖线性参考序列的方法无法识别的变体。”

结构变异可能涉及数千个碱基。到目前为止,由于使用单一参考序列的偏差,研究人员一直无法使用短读长测序来识别每个人类基因组中存在的大多数结构变异。

“人类泛基因组参考将使我们能够代表基因组区域中数以万计的新基因组变异,这些变异以前是无法获得的,”博士 Wen-Wei Liao 说。耶鲁大学的学生和该论文的共同第一作者。“有了泛基因组参考,我们可以通过提高对基因和疾病特征之间联系的理解来加速临床研究。”

五年内支持人类泛基因组参考联盟工作的总成本预计约为 4000 万美元,其中包括努力创建人类泛基因组参考、改进 DNA 测序技术、运营协调中心、开展外展活动以及为研究界使用泛基因组参考。

版权声明:本文由用户上传,如有侵权请联系删除!