从云层后面揭开太阳重塑化学图像分辨率
拉曼光谱以无损、无标记的方式原位检测样品化学成分的分子键信息(术语>>>)。它是生物和临床医学研究中新兴的代谢相关光谱组学技术,有望推动精准医学的发展。目前,拉曼光谱应用于体液、外泌体、细胞/微生物、组织等生物医学检测,其中生物组织拉曼高光谱成像可以提供化学分子键的三维空间分布信息,有望成为一种强大的检测手段。筛选和研究身体和疾病发生和发展的分子机制的工具。
然而,由于拉曼散射信号较弱,它容易受到仪器、环境噪声和背景信号(非拉曼信号/基线)的干扰。这些噪声和基线信号的叠加严重影响了拉曼光谱本征信号(拉曼峰)的分离和分辨率,限制了拉曼光谱的应用和普及,特别是跨仪器、样品和光谱类型的应用和普及。生物样品成分的复杂性和荧光信号的严重干扰,使得拉曼光谱的生物医学应用变得困难。具有高效光谱噪声去除和高保真基线校正能力的光谱预处理方法是高质量拉曼光谱应用的前提和挑战。
挑战
传统的数值分析方法需要多次手动调整参数才能达到更好的降噪和基线校正效果,不适合临床诊断、高光谱图像处理等高通量应用场景。
现有的深度学习预处理方法具有自动调参的优点。然而,噪声去除和基线校正光谱保真度仍需要提高,以实现跨仪器和样品的通用应用。
传统的监督深度学习光谱预处理方法的性能依赖于高质量的标签数据训练。这种标签数据没有噪声和基线,可以通过对多个采集光谱进行平均来降低噪声,而基线通过常规仪器采集很难消除。此外,该方法训练的深度学习模型在跨仪器、跨样本使用时需要重新收集数据并重新训练。他们的泛化能力有待提高。
当使用数学模拟数据集进行训练时,虽然可以跨仪器和样本进行适配,但由于实际光谱噪声/基线与数值模拟之间的差异,预处理模型的光谱保真度对于生物医学样本拉曼仍然不足高光谱图像预处理。
具有高保真度和泛化能力的拉曼光谱预处理算法
近日,南方科技大学电子电气系、光纤光缆制造技术国家重点实验室、广东省集成光电子与智能感知重点实验室的Perry Ping Shum教授团队及其合作者提出了两步走的方案基于自监督学习的拉曼光谱预处理策略(RSPSSL),实现跨仪器、样本和光谱类型的高保真光谱去噪和基线校正,促进临床组织样本拉曼高光谱图像的化学分辨率可视化。
文章“RSPSSL:一种新颖的高保真拉曼光谱预处理方案以增强生物医学应用和化学分辨率可视化”发表在《Light: Science & Applications》上。博士 胡佳琪博士为第一作者,陈金娜副研究员(共同第一作者)和沈平教授为通讯作者。
该方案第一步是根据拉曼峰、噪声和基线之间物理关系的相互独立性建立自监督模型,对未标记的训练光谱进行自分解、重排和重构,构建生成对抗网络获得生成无限数量标记的高仿真拉曼光谱对的能力,解决未标记的真实拉曼光谱的问题。
无标记训练光谱采用来自多个实验室的仪器、样品和光谱类型的不同数据,以获得噪声和基线的多样性。其次,为了适应实际光谱数据的复杂性,预处理模型通过多个子模块的端到端连接,增强了复杂信号的拟合能力。预处理模型 RSBPCNN #可用于任何仪器、样品和光谱类型的拉曼光谱预处理,无需人工干预或重新训练。
预处理模型RSBPCNN#具有优异的噪声去除和基线校正能力,处理后的光谱保真度高。这种提取具有不同信噪比的微弱信号的能力减少了采样时间并改进了下游应用。
多功能拉曼光谱预处理
我们在本研究中使用了多个实验来验证模型的普遍性。无需任何改动,预处理模型RSBPCNN #直接应用于癌症诊断、除草剂浓度预测、高光谱成像等领域,显着提升了应用效果。该方法显着提高了少样本应用情况下的诊断和浓度预测精度,并进一步验证了光谱预处理的保真度。同时,这些实验数据来自不同的仪器和实验室,展示了它们的跨仪器适应性。
高光谱图像质量改进
拉曼高光谱图像最独特的功能是体积化学成像。然而,由于基线信号叠加,微弱的生物成像信号不可见。应用预处理模型 RSBPCNN #恢复拉曼峰强度以重建化学特异性图像。同时,该方法还可以显着提高信噪比,并减少数十倍的采样时间。
总结与展望
本研究提出了一种自监督两步拉曼光谱预处理的新策略RSPSSL,通过精致的算法对各种光谱特征进行精细分离和重建,获得并生成无限数量的标记高保真模拟光谱数据集模型设计并训练和优化具有高拟合能力的优势预处理模型,以获得具有高鲁棒性的目的RSBPCNN #。该模型无需人工干预即可实现任意拉曼光谱噪声消除和基线校正的高通量。由于其光谱高保真特性,可以显着提高实验中癌症诊断和溶液浓度预测的准确性,提高全高光谱图像的全光谱质量,消除生物静默区的背景信号,实现癌症的可视化光谱指纹区域中图像的化学分辨率,反映了仪器、样品和光谱类型的广谱适用性。未来,通过涉及光谱的空间分布,可以进一步提高高光谱图像的分辨率。
版权声明:本文由用户上传,如有侵权请联系删除!