近日,我校人工智能研究院左春满博士在从空间转录组学数据解析癌症异质性方面取新进展,这一成果以“Elucidating tumor heterogeneity from spatially resolved transcriptomicsdata by multi-view graph collaborative learning(从空间转录组数据解析癌症异质性的多视图协同学习方法)”为题发表在国际知名期刊《自然-通讯》(Nature Communications)上。左春满为第一和共同通讯作者,第一单位为东华大学人工智能研究院。
癌症异质性是指在肿瘤生长过程中,其子细胞呈现出不同的形态和表型特征,从而使肿瘤对药物的敏感性和预后等各方面产生差异,这为精准医疗带来了重大挑战。空间转录组学技术是一个快速发展的领域,可在空间分辨率下量化基因表达水平,为解析癌症的复杂异质性结构提供了新的技术手段。然而,空间转录技术存在低通量和灵敏度以及非常稀疏和嘈杂等问题,其数据分析仍具有挑战性。如何根据空间转录组学数据解析癌症的异质性?
东华大学人工智能研究院左春满博士与中国科学院生物化学与细胞生物学研究所陈洛南研究员合作提出了一种从空间转录数据解析肿瘤内空间异质性的深度学习方法stMVC。该方法(图1)使用多模态数据(组织学图像、空间位置、基因表达和肿瘤空间位置等信息)作为输入,首先通过图像增强和对比学习技术,学习组织学图像的视觉特征并构建相似度图;随后在肿瘤空间位置的半监督下,采用半监督图注意力自编码器分别学习组织学相似度图和空间位置图的特异性低维表征;最后通过注意力机制协同集成两个视图来获得鲁棒的低维表征(R)。随后,该表征被用于后续的细胞状态识别、可视化和数据去噪。
图 1: stMVC算法工作流程图
在对卵巢癌的空间转录数据分析上(图2,a-g),与其他竞争方法相比,stMVC能识别具有空间特异性的不同功能的细胞状态,这些细胞状态受到其浸润的免疫微环境的影响,其中具有高浸润cancer-related fibroblast(CAF)的细胞状态与疾病预后呈显著相关,这与已发表的研究相一致。
在乳腺癌的空间转录数据分析上(图2,h-l),作者进一步采用stMVC识别了与疾病相关的过渡细胞状态,并通过已发表的乳腺癌单细胞转录测序和TCGA数据验证了这些科学发现。
图 2: stMVC识别了分布在卵巢癌(a-g)和乳腺癌(h-l)不同空间区域的细胞状态
综上所述,作者提出了一种集成空间转录的多模态数据(包括组织学图像、空间位置、基因表达和肿瘤空间位置等信息)解析癌症空间异质性的新方法stMVC。随着空间转录技术的推广,stMVC将为空间转录数据的临床和预后应用提供新助力。
该研究工作得到“上海市青年科技英才扬帆计划”项目和“东华大学基本科研业务费专项资金”项目经费的支持。