研究人员利用人工智能、MicroRNA设计多类癌症诊断工具
癌症是世界上最具破坏性的疾病之一。到2023 年,预计仅在就会出现超过 190 万新癌症病例和 609,820 人亡。随着诊断工具的不断改进,microRNA 处于生物医学研究的前沿。
MicroRNA 或 miRNA 是一类小型非编码核糖核酸 (RNA),对所有生物功能至关重要。miRNA在人体内的主要作用是基因调控。因此,它们调节多种生物和病理过程,包括癌症的形成和发展。事实上,许多癌症与 miRNA 功能密切相关。
miRNA 与癌症发展的关联激发了人们对研究 miRNA 表达谱数据作为一种潜在的侵入性较小的早期检测诊断工具的兴趣。机器学习方法已用于开发高性能泛癌分类模型,并识别用于临床研究的潜在新型 miRNA 生物标志物。然而,了解这些数据科学技术如何与已建立的生物过程相关联以促进融入临床环境是关键。
为了进一步探索 miRNA 作为癌症分类生物标志物的可行性并改善临床分类应用,佛罗里达大西洋大学工程与计算机科学学院的研究人员利用 miRNA 表达谱创建了多类癌症诊断模型。他们的方法采用迭代过程,将多项关键技术应用于不断增加的 miRNA 表达量化数据集。
在这项研究中,研究人员评估了机器学习模型选择的顶级 miRNA 特征与临床和生物学验证的 miRNA 生物标志物的关系。他们开发了用于癌症分类的支持向量机和随机森林机器学习模型,并迭代地将癌症类别添加到多类别模型中。他们研究了通过特征选择识别的相关 miRNA 与 20 次迭代中分类模型的性能指标之间的关系。每次迭代都会向多类模型添加另一个主要样本位点,从而增加涉及的癌症类型的数量。
研究人员检查了随着更多癌症类型引入子集而成功指标的变化、随着更多癌症类型引入子集而 20-miRNA 特征如何变化,以及通过主成分分析(一种用于分析包含大量维度或特征的大型数据集的流行技术)完整数据集的特征。
之前的研究只关注最终多类数据集的 miRNA 特征特征,与此不同的是,本研究跟踪了每次添加癌组织类型后临床和生物学相关性的变化。
这项研究结果发表在电气和电子工程师协会的期刊IEEE Xplore上,表明具有更多癌症类别的模型转向关注与特征功能更相关的癌症多样化 miRNA。研究表明,miRNA对于特定的癌组织可能是高度独特的,并且可以成为检测和分类的强有力的生物标志物;然而,当前经过验证的生物标志物在检测癌症时倾向于更多癌症范围内的 miRNA。
该研究深入了解了特征提取特征的整体临床相关性与模型成功指标之间的潜在关系,并证明了使用多组织 miRNA 癌症特征作为多种重要癌症中单类癌症检测的通用特征的可行性。
研究结果表明,随着癌症类别数量的增加,性能指标下降,但 miRNA 特征选择特征的相关性百分比在稳定之前略有增加。此外,在进行主成分分析后,所有样本的非癌组织都具有非常相似的表达可视化,而所有癌组织都具有独特的特征。
“MicroRNA 对未来的诊断测试具有重大前景,因为它们可以直接从血液、尿液或唾液等生物体液中检测到,而且高质量的 miRNA 测量技术也可用,”通讯作者、博士生 Oneeb Rehman 说。FAU 工程与计算机科学学院电气工程与计算机科学系的候选人。“这使得理解和表征潜在 miRNA 分类工具背后的生物学基础对于融入临床环境至关重要。”
在雷曼的监督下,来自电气工程和计算机科学系的马修·阿克斯和理查德·阿克斯领导的一个由高年级设计本科生和合著者查尔斯·布里安迪和伊恩·尤班克斯组成的团队参与了这项研究。合著者、电气工程与计算机科学系系主任、教授庄汉奇博士担任团队导师。
FAU 工程与计算机科学学院院长Stella Batalama博士表示:“这项研究探索了 microRNA 的组成与各种类型癌症之间的关系,对于 miRNA 作为生物标志物在研究和临床领域的潜在用途具有重要意义。” “这项研究特别令人印象深刻的是,它涉及我们的一些本科生,他们合作研究一种更好的方法来管理每年影响全世界数百万人的疾病。”
版权声明:本文由用户上传,如有侵权请联系删除!