新型机器学习血液检测可检测无细胞DNA单分子中存在全基因组突变的癌症
约翰·霍普金斯金梅尔癌症中心的研究人员正在开发一种新颖的血液检测技术,该技术结合了对肿瘤脱落的单分子DNA 进行全基因组测序和机器学习,可以更早地检测出肺癌和其他癌症。
这项名为 GEMINI(癌症非侵入性检测的全基因组突变发生率)的测试旨在寻找整个基因组中 DNA 的变化。首先,从有患癌症风险的人身上采集血液样本。然后,从血浆中提取肿瘤脱落的游离 DNA (cfDNA),并使用经济高效的全基因组测序进行测序。分析单分子 DNA 的序列改变,并用于获取整个基因组的突变谱。最后,使用经过训练来识别基因组不同区域的癌症和非癌症突变频率变化的机器学习模型来区分患有癌症的人和未患有癌症的人。分类器生成 0 到 1 之间的分数,分数越高,患癌症的可能性越高。
在 GEMINI 的一系列实验室测试中,研究人员发现,该方法在进行计算机断层扫描成像后,可以检测出超过 90% 的肺癌,包括 I 期和 II 期疾病的患者。这项工作的描述是一项概念验证研究,于 7 月 27 日在线发表在《自然遗传学》杂志上。
“这项研究首次表明,像 GEMINI 这样的测试结合了单分子 cfDNA 的全基因组突变谱,与其他癌症检测方法相结合,可用于癌症的早期检测,以及在癌症治疗期间监测患者。疗法,”资深研究作者Victor Velculescu 博士说。金梅尔癌症中心肿瘤学教授兼癌症遗传学和表观遗传学项目联席主任。
该研究的主要作者、约翰·霍普金斯大学医学院人类遗传学项目的研究生丹尼尔·布鲁姆 (Daniel Bruhm) 表示,这项研究主要集中在高危人群中肺癌的检测。“然而,我们检测到患有其他癌症(包括肝癌、黑色素瘤或淋巴瘤)患者的 cfDNA 突变谱发生了改变,这表明它可能会得到更广泛的应用,”Bruhm 说。
为了开发 GEMINI,研究人员检查了全基因组泛癌症分析研究中 2511 人的 25 种不同癌症的全基因组序列,确定了不同肿瘤类型的基因组中不同的突变频率。例如,肺癌的每个基因组平均有 52,209 个体细胞突变。研究人员还确定了突变数量最多的基因组区域,发现肺癌、黑色素瘤或 B 细胞非霍奇金淋巴瘤患者的肿瘤组织和血液来源的 cfDNA 之间突变频率高的基因组区域相似。
研究人员评估了 GEMINI 检测纵向城市队列老化研究 (LUCAS) 中 365 人 cfDNA 序列改变的能力,该研究是一组患有肺癌的高风险人群。癌症患者的 GEMINI 得分高于未患癌症的患者。研究人员还评估了 GEMINI 是否可以与 DELFI(早期拦截片段的 DNA 评估)结合使用,DELFI 是一种先前开发的测试,可检测整个基因组中 cfDNA 片段的大小和分布的变化,以改善早期肺癌的检测。使用组合技术检测到了 GEMINI 遗漏的几个癌症样本。在 LUCAS 队列中的 89 个肺癌患者样本中,GEMINI 结合 DELFI 正确检测出癌症的率为 91%。
研究人员还研究了 GEMINI 在其他研究样本中的使用情况,其中包括 7 名在采血时没有任何可检测到的肿瘤的患者。他们的 GEMINI 得分中位数为 0.78,高于未患癌症的人。其中 6 名患者使用 GEMINI 检测呈阳性,并在获得样本后 231 至 1,868 天被诊断出患有肺癌,这表明 cfDNA 突变谱的异常可以在标准诊断前数年被检测到。
其他实验确定 GEMINI 可以区分肺癌的亚型,并可以检测早期肝癌。在一组接受肺癌药物治疗的患者中,GEMINI 评分在治疗初期反应期间下降,表明该测试可用于在治疗期间监测患者。
肿瘤学副教授 Rob Scharpf 博士表示,结果表明,全基因组 GEMINI 突变分析和 cfDNA DELFI 片段分析相结合“可能为经济高效、可扩展的癌症检测提供机会”在金梅尔癌症中心。他说,在该工具可供临床使用之前,需要进行更大规模的临床试验来验证该工具。
其他研究合著者包括约翰·霍普金斯大学的 Dimitrios Mathios、Zachariah Foda、Akshaya Annapragada、Jamie Medina、Vilmos Adleff、Elaine Jiayuee Chiao、Leonardo Ferreira、Stephen Cristiano、James White、Amy Kim、Valsamo Anagnostou 和 Jillian Phallen。其他作者来自波士顿大学和匹兹堡阿勒格尼健康网络癌症研究所。
版权声明:本文由用户上传,如有侵权请联系删除!