上海交大考研,上海交大考研分数线
癌症是人类健康和生存的重大威胁之一,3-5%的癌症病人原发病灶无法确认,导致难以制定合适的诊疗方案。循环肿瘤细胞(circulating tumor cells,CTC)是从癌症的原发灶或者转移灶上脱落进入人体循环系统的一类癌症细胞,是癌症转移的前驱体。液体活检技术可从血液中无创捕获CTC,而CTC的识别和病灶溯源将有助于癌症的无创早期诊断和治疗指导。近年来,随着单细胞组学技术的发展,其被证明是一种刻画细胞异质性、研究细胞谱系的极佳手段,将其应用于CTC的相关研究有望进一步基于CTC深入挖掘病灶信息(如病灶定位)从而推进基于液体活检的精准诊疗。但因血液中CTC含量稀少导致其捕获、表征困难,且相关的工作往往着力于CTC的前期捕获和简单的计数研究使得目前CTC单细胞转录组数据积累匮乏,难以用于CTC图谱的构建从而实现细胞病灶溯踪研究。
面对这一挑战,近期上海交通大学医学院分子医学研究院应用团队宋佳副研究员、厦门大学化学化工学院杨朝勇课题组(杨朝勇教授、张惠敏副研究员)与墨尔本大学助理教授刘峰等人开发了一种基于深度迁移学习,专用于 CTC 识别、病变追踪和基因标记的算法, CTC-Tracer 。该算法通过深度迁移学习 , 基于单细胞转录组学测序( scRNA-seq )积累的大量原发肿瘤细胞测序数据图谱,实现了从原发肿瘤细胞到 CTC 的知识迁移,从而可实现基于液体活检靶标 -CTC 的单细胞转录数据揭示癌症病灶位置,极大地提升了液体活检 CTC 研究在癌症临床治疗中的应用价值。相关工作以“Deep transfer learning enables lesion tracing of circulating tumor cells”为题发表在Nature Communications。
【文章要点】
CTC-Tracer 基于深度域自适应算法将带有病灶标注信息的原生组织肿瘤细胞的 scRNA-seq 表达矩阵作为源域数据集( Source data ),无标注信息的 CTC scRNA-seq 表达矩阵数据作为目标域数据集( Target data ),通过迁移学习算法实现从源域数据集到目标域数据集的知识迁移,从而预测出 CTC 的病灶来源。与目前先进的细胞注释 / 映射算法(部分算法亦整合其他迁移学习模型)相比, CTC-Tracer 展示出明显优越的 CTC 病灶溯源性能,并且可以极大地减弱数据中包含的因批次效应引入的域差异。当应用于来自一名患者和两个异种移植的 CTC 小鼠数据时, CTC-Tracer 在该数据集(单个 CTC 、 CTC-CTC 簇和 CTC-WBC 簇)上展现高溯源准确性( 83.33-100% )。并且 CTC-Tracer 在溯源来自不同平台、不同癌症类型的 CTC 数据时,表现出优异的稳定性能,展现出模型应用于广泛 CTC 数据集的潜力。
图1 CTC-Tracer原理示意图
【小结】
总的来说,面对目前 CTC 单细胞数据积累有限这一问题,该研究首次利用迁移学习将肿瘤组织细胞病灶标签迁移到 CTC 单细胞样本,不但有效解决了 CTC 单细胞数据稀少的问题也同时解决了批次效应对细胞注释的影响,从而很好地解决 CTC 识别和病灶溯源问题; CTC-Tracer 在 CTC 病灶溯源准确性、灵敏性、以及面对各类噪音的鲁棒性上均具有较好的表现,该研究一定程度上推进了 CTC 与液体活检在临床检验上的应用,提供了一种癌症病灶溯源的新思路。
https://www.nature.com/articles/s41467-022-35296-0
相关进展
化学与材料科学原创文章。欢迎个人转发和分享,刊物或媒体如需转载,请联系邮箱:chem@chemshow.cn
微信号 : Chem-MSE
诚邀投稿
欢迎专家学者提供化学化工、材料科学与工程产学研方面的稿件至chem@chemshow.cn,并请注明详细联系信息。化学与材料科学®会及时选用推送。
上海交大考研(上海交大考研分数线)