新的深度学习框架改进空间转录组学分析
来源:News-Medical
语言:英语,所在国:日本
分类:科技 , 关键词:AI与医疗健康
生物组织由不同类型的细胞按特定模式排列组成,这些模式对其正常功能至关重要。了解这些空间排列对于研究细胞如何相互作用和响应环境变化,以及深入了解癌症等病理现象至关重要。过去十年中,空间转录组学(ST)技术迅速发展,使科学家能够在保持组织结构完整的情况下绘制基因活动图谱,从而更深入地了解健康和疾病状态。
然而,基于基因活动识别不同的组织区域仍然具有挑战性,因为不同方法难以平衡遗传数据与空间组织。例如,一些ST方法依赖于任意定义的距离参数,这可能无法准确反映生物学边界。其他方法通过结合多个组织图像来提高准确性,但受限于图像质量和数据可用性的不一致。此外,由于技术差异,来自不同实验的图像数据比较也较为困难,通常需要手动调整以正确对齐数据集并实现批量集成。
为了解决这些问题,由东京大学医学科学研究所的中井贤太教授领导的研究团队开发了一个名为STAIG(Spatial Transcriptomics Analysis via Image-Aided Graph Contrastive Learning)的深度学习框架。这项研究于2025年1月27日在线发表在《自然通讯》上,介绍了STAIG框架,该框架整合了基因表达、空间数据和组织学图像,无需手动对齐,取得了卓越的结果。共同作者包括中井教授实验室的多位成员,特别是他的博士生杨一涛。
STAIG通过将组织学图像分割成小块并使用自监督模型提取特征,消除了对广泛预训练的需求。然后,它从这些特征构建图结构,战略性地整合空间信息以有效管理垂直堆叠的图像。在这些图中,节点代表基因表达数据,而边反映了空间邻近性。通过一种称为图对比学习的先进方法,STAIG识别关键空间特征,使其能够将不同的基因表达模式映射到特定的组织区域。“STAIG利用强大的模型架构和额外的图像数据,实现了高精度的空间域识别,同时无需对齐组织切片或进行手动调整,”中井教授概述了该模型的一些主要优势。
研究团队进行了广泛的基准评估,将STAIG与其他最先进的ST技术进行了比较。结果表明,STAIG在各种条件下表现出优越的性能,包括在没有空间对齐或缺少组织学图像的数据集中。在人类乳腺癌和斑马鱼黑色素瘤的数据集中,STAIG成功识别了高分辨率的空间区域,包括现有方法难以检测的挑战性区域。此外,它精确地划分了肿瘤边界和过渡区,展示了其在癌症研究中的潜力。
研究人员对其提出的框架及其在医学研究和生物学中的潜在应用寄予厚望。“STAIG将加速利用空间转录组数据来理解生物系统的复杂结构,包括癌细胞与其周围细胞之间的相互作用以及发育胚胎中器官的形成,”中井教授总结道,“我们的研究将增进我们对大脑如何工作、癌细胞如何发展以及人体如何构建的理解。这种知识将促进多种疾病的新治疗方法的发展。”
(全文结束)