肌浸润性尿路上皮癌(MUC)具有高侵袭性和显著的异质性,目前缺乏高度精确的个体化治疗选择。作者使用计算流程对MUC患者的多组学数据进行综合分析,采用10种聚类算法,并结合10种机器学习算法,以识别高分辨率的分子亚群,并开发出一个稳健的共识机器学习驱动签名(CMLS)。
1. MUC的多组学共识预后相关分子亚型
这项研究的工作流程如图1所示。在对所有数据进行有效预处理后,作者通过主成分分析(PCA)进一步验证了作者的结果,以分析处理批次效应前后的数据。作者独立地从10个多组学集成聚类算法中确定了三个亚型,并通过综合参考聚类预测指数、间隙统计分析、轮廓分数和以往的研究经验来确定亚型的数量。然后,通过共识集成方法进一步结合了转录组(mRNA、lncRNA和miRNA)、表观遗传甲基化和体细胞突变的独特分子表达模式来得到聚类结果(图2A-2C)。作者的分类系统与总体生存率(OS)密切相关(p < 0.001;图2D)。值得注意的是,在所有评估的亚型中,癌症亚型2(CS2)表现出最有利的生存结果。
图1 建立CMLS的计算框架
图2 MUC的多组学整合共识亚型
2. MUC整合共识分子亚型的分割
目前,大多数MUC的分子亚型是根据分子表达水平进行分类的,可能与特定的生物功能有关。因此,作者还尝试探索这些CS的不同分子特征。单样本基因集富集分析(ssGSEA)算法测量了样本中不同分子标志物的富集程度。有趣的是,作者发现在CS2中明显富集了如腺上皮分化和尿路上皮分化等途径,而在CS3中明显富集了如基底分化和免疫分化等途径,这表明CS2可能更容易倾向于目前认可的腺上皮样亚型,而CS3更倾向于基底样亚型。此外,不同亚型对特定治疗的反应也存在较大差异,如CS2中明显富集了免疫抑制性致癌途径,而C