你可以永远相信铁死亡,4+机器学习+分型+实验的干湿结合机制

今天给同学们分享一篇铁死亡+机器学习+分型+实验的生信文章“Identification of Ferroptosis-Related Biomarkers for Diagnosis and Molecular Classification of Staphylococcus aureus-Induced Osteomyelitis”,这篇文章于2023年4月26日发表在J Inflamm Res期刊上,影响因子为4.5。
e62c58668feeae0bd2e945f99e7425c8.jpeg

金黄色葡萄球菌(SA)引起的骨髓炎(OM)是骨科中最常见的难治性疾病之一。早期诊断有助于改善患者的预后。铁死亡在炎症和免疫反应中起着关键作用,而铁死亡相关基因(FRGs)在SA引起的OM中的机制仍不清楚。本研究旨在通过生物信息学确定铁死亡相关基因在SA引起的OM的诊断、分子分类和免疫浸润中的作用。


1. 在训练集中识别差异表达基因(DE-FRGs)

在合并和消除批次效应后的85个SA诱导的OM样本和35个正常样本中,获得了41个差异表达的基因(DE-FRGs),其中30个显著上调,11个显著下调。聚类热图的结果(图1a)显示了这41个差异表达基因在不同样本中的表达情况。这些基因的相关性分析(图1b)显示,SLC38A1与ATG7、TLR4、CTSB和LAMP2呈显著负相关,与CIRBP呈显著正相关。除了与BID呈负相关外,MAPK9与其他40个差异表达基因没有相关性。

f0060006584d0483f1aa911858787e2d.jpeg

图1 OM中DE-FRG的表达水平和相关性


2. 差异表达功能富集分析

我们通过基因富集分析进一步探索了41个差异表达的FRG的生物功能和通路。在GO富集分析中(图2a和b),对氧化应激的反应、富含菲科林-1的颗粒和DNA结合转录激活因子活性以及RNA聚合酶II特异性是BP、CC和BF最显著富集的GO术语。在KEGG通路分析中(图2c),差异表达基因主要参与了坏死程序、脂质和动脉粥样硬化以及HIF-1信号通路。因此,上述证据表明,差异表达的FRG可能通过参与凋亡和转录因子的调控,在SA诱导的OM的发病机制中发挥作用。

d87e6dac465ed363ba588673289d0181.jpeg

图2 GO和KEGG通路中差异表达基因的功能富集分析


3. 根据显著的差异表达功能基因(DE-FRGs),为OM确定了诊断生物标志物

为了区分OM患者和健康样本,我们进一步筛选了诊断基因,并将LASSO和SVM-RFE两种机器学习算法引入到训练集(GSE6269和GSE16129数据集)中。具体而言,我们使用逻辑回归算法进行了10轮交叉验证,并从41个差异表达基因中选择了11个显著的基因标志物(图3a和图3b),然后,通过SVM-RFE算法筛选出了41个DE-FRGs,并选择了18个显著的基因生物标志物(图3c和3d)。从LASSO和SVM-RFE模型中获得的遗传生物标志物进行了交集运算,最终得到了8个显著的生物标志物(SLC38A1、MAPK9、SNCA、KLF2、EGR1、STAT3、SREBF2和ABCC5)(图3e)。基于这8个显著的生物标志物绘制了ROC诊断曲线,所有基因的AUC值均大于0.65,表明每个显著基因生物标志物都能很好地区分OM样本和健康样本(图4a)。有趣的是,我们使用了“glmnet”包建立了一个Logistic回归模型,ROC曲线的结果显示,基于八个特征基因标记的回归模型的准确性高于单个基因标记的诊断效率(AUC=0.993,95% CI: 0.979–0.100)(图4b)。最后,我们使用“rms”包构建了一个诊断OM发生率的图表模型(图4c)。校准曲线的结果显示,该图表模型的预测基本与理想模型一致(图4d),基于该模型的临床决策对于SA诱导的OM患者可能是有益的(图4e)。

1c781ba021be45775e0b4e43934cdcf3.jpeg

图3 根据显著的差异表达功能基因(DE-FRGs),确定了8个口腔黏膜炎(OM)的诊断生物标志物


64b5a711fc41379e9a13210cfef53249.jpeg

图4 基于8个诊断生物标志物的ROC曲线和Nomogram模型


4. 诊断生物标志物与OM相关富集途径相关联

为了进一步探索与SA诱导的OM诊断相关的8个特征生物标志物的分子机制,通过ssGSEA-KEGG通路富集分析对每个基因生物标志物进行了分析。图表显示了最多的前6个富集通路(图5a-d)。综合分析结果表明,这8个特征生物标志物在细胞周期、fc-gamma-r介导的吞噬作用、溶酶体、核糖体、剪接体、轴突引导、细胞黏附分子、受体相互作用(细胞外基质受体相互作用、神经活性配体受体相互作用和细胞因子-细胞因子受体相互作用)和脂质代谢(甘油磷脂代谢和肌醇磷酸代谢)等通路中显著富集。此外,这些基因生物标志物还在多个信号通路(类似结节受体信号通路、TGF-beta信号通路和ERBB信号通路)和多种疾病(小细胞肺癌、致心律失常性右室心肌病和肌萎缩性脊髓侧索硬化症)中显著富集。

f1484a15f0d71b875192b89dd9dc0d10.jpeg

图5

 

根据每个生物标志物的中位表达水平,SA诱导的OM样本被分为高表达组和低表达组,并通过GSVA富集分析探索了两组之间的富集通路。综合分析的结果表明,SLC38A1的高表达可能会激活补体和凝血级联反应、泛酸和辅酶A生物合成以及柠檬酸循环TCA循环通路,而SLC38A1的低表达可能会激活烟酸和烟酰胺代谢以及近曲小管碳酸氢盐回收通路(图6a)。EGR1的高表达与α-亚麻酸代谢、DNA复制和花生四烯酸代谢有关,而EGR1的低表达与肠道免疫网络中的IgA产生和乳糖和新乳糖系列的糖脂生物合成有关(图6b)。与EGR1一致,KLF2的高表达也可能激活花生四烯酸代谢和α-亚麻酸代谢通路,而KLF2的低表达可能激活自身免疫性甲状腺疾病和近曲小管碳酸氢盐回收通路。在STAT3高表达组中,与氨基酸代谢相关的途径(酪氨酸代谢、烟酸和烟酰胺代谢以及丁酸代谢)显著富集,而在STAT3低表达组中,补体和凝血级联反应以及乙酰乙酸和二羧酸代谢富集。SREBF2的高表达仅与视黄醇代谢和亚油酸代谢有关,而SREBF2的低表达主要与肠道免疫网络中的IgA产生和乳糖和新乳糖系列的糖脂合成有关。同样,SNCA的高表达仅与烟酸和烟酰胺代谢以及丁酸代谢有关,而SNCA的低表达主要与乙酰乙酸和二羧酸代谢以及甘氨酸、丝氨酸和苏氨酸代谢有关。高表达的MAPK9仅与碱基切除修复途径有关,而高表达的ABCC5仅与牛磺酸和低牛磺酸代谢有关。这些结果表明,8个显著的生物标志物可能通过免疫反应和氨基酸代谢相关途径调节SA诱导的OM的发病机制。

67500022e0ae4cf8815e73c7048dd994.jpeg

图6 根据每个基因生物标志物的表达水平,高表达组和低表达组之间的差异激活途径


5. 免疫微环境分析

SA引起的中耳炎的病理生理机制涉及炎症和免疫反应,许多免疫细胞和因子参与了其发病机制。因此,为了探索SA引起的中耳炎的免疫反应机制,我们使用CIBERSORT算法评估了中耳炎患者和健康患者之间免疫细胞丰度的差异(图7a)。结果显示,中耳炎样本中T细胞滤泡辅助细胞、T细胞调节细胞(Tregs)、单核细胞、巨噬细胞M0、巨噬细胞M2、静息型肥大细胞、嗜酸性粒细胞和中性粒细胞的丰度显著高于对照样本,而记忆型B细胞、CD4纯化T细胞和静息型自然杀伤细胞的丰度显著低于对照样本。免疫相关性分析结果表明,SLC38A1和KLF2与巨噬细胞M2呈强烈负相关,而SREBF2、STAT3和EGR1与中性粒细胞呈强烈正相关(图7b)。SA引起的中耳炎的免疫微环境可能与SLC38A1、KLF2、SREBF2、STAT3和EGR1有关。

55541c94ec7bb70ac7ed951c8847f81c.jpeg

图7 免疫微环境分析


6. 基于显著差异表达基因的分子亚型结果

基于8个重要的生物标志物,共建立了9个聚类结果。为了筛选出最适合的分子亚型,一致性得分和CDF值被用作参考(图8a-c)。最佳的聚类结果是K=2,一致性得分接近1.0。为了验证亚型1和亚型2样本之间的差异,PCA显示不同亚型之间的转录组存在显著差异(图8d)。然后,箱线图和相关热图的结果显示,MAPK9、SNCA、KLF2和STAT3在亚型1中高表达,而SLC38A、EGR1和ABCC5在亚型2中高表达(图9a和b)。最后,我们探索了亚型1和亚型2之间的免疫微环境特征的差异(图9c和d)。结果显示,亚型1的OM具有更高的免疫细胞浸润率,主要是T细胞CD4记忆静止态、巨噬细胞M0、巨噬细胞M2、树突状细胞静止态和树突状细胞活化态。亚型2的OM中,T细胞CD4幼稚态和NK细胞静止态的浸润丰度较高。

3573cfdb160871f4550b22b9dfad1c49.jpeg

图8 基于8个基因生物标志物的聚类分析得出的分子亚群

48fb0e2fb66311a90190d5954ee854b5.jpeg

图9 两个不同簇之间基因表达水平和免疫微环境特征的差异


7. 基于验证集的诊断、表达和临床相关性分析的验证

为了验证基于8个显著生物标志物的逻辑回归模型在区分SA诱导的OM样本和正常样本方面的能力,我们使用了GSE30119数据集作为验证集。ROC曲线分析的结果表明,8个显著生物标志物能够区分OM样本和正常样本(图10a)。此外,我们验证了39个OM样本和44个健康样本之间8个特征生物标志物的表达差异(图10b-i),结果显示SNCA、EGR1、SREBF2、MAPK9和STAT3在OM样本中高表达,而SLC38A1、KLF2和ABCC5在OM样本中低表达(P<0.05),这与训练集分析的结果一致。临床相关性分析的结果显示,除了STAT3与OM患者年龄之间存在正相关外,其他基因生物标志物与年龄之间没有显著相关性(图11a-h)。

23ca9b381c3ae7349c317a14c688601e.jpeg

图10 验证集中的逻辑回归模型和基因生物标志物的表达水平

4c00ffd45a95da6834a9bf7929b3c661.jpeg

图11 8个基因生物标志物与OM患者年龄之间的临床相关性分析


8.8个基因生物标志物与OM患者年龄之间的临床相关性分析

为了验证8个基因标记物的表达水平,我们建立了和验证了OM大鼠模型,通过RT-qPCR实验(图12a-h)。RT-qPCR结果表明,MAPK9、SNCA、EGR1、STAT3和SREBF2在OM病变组织中高表达,而SLC38A1和KLF2在对照组中高表达。基因表达趋势与训练集(GSE6269和GSE16129数据集)和验证集(GSE30119数据集)完全一致。此外,虽然OM组和对照组的ABCC5 mRNA表达水平没有显著差异,但与GSE30119数据集中的基因表达趋势一致。

5b117bfa114d99bf33bead8b81c11959.jpeg

图12 RT-qPCR验证


总结

总之,SLC38A1、MAPK9、SNCA、KLF2、EGR1、STAT3、SREBF2和ABCC5被确定为特征生物标志物。我们建立了一个对SA诱导的OM患者进行诊断的模型,具有良好的诊断价值。基于8个特征的铁死亡相关基因,在亚型1和亚型2的OM之间存在显著的免疫微环境差异。这项研究将有助于开发SA诱导的OM的早期诊断指标和免疫治疗方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信风暴

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值