8+NETosis+机器学习+表达验证

今天给同学们分享一篇NETosis+机器学习+表达验证的生信文章“Identification and validation of immune-associated NETosis subtypes and biomarkers in anti-neutrophil cytoplasmic antibody associated glomerulonephritis”,这篇文章于2023年7月3日发表在Front Immunol期刊上,影响因子为8.786。
9cc23b851855b9e7f23db2e76499a8f9.jpeg


NETosis是一种新的细胞死亡形式,以死亡中性粒细胞释放DNA染色质为特征。虽然它有助于微生物防御,但可能会加剧自身免疫性疾病中的炎症,导致组织损伤。NETosis对抗中性粒细胞胞浆抗体相关的肾小球肾炎(ANCA-GN)的影响尚未被探索,需要进一步调查。

3737524f78d1dc39c494b5dc07e51380.jpeg

图1 研究流程图


1. 共表达网络构建和关键模块识别

筛选出ANCA-GN中的差异表达基因。首先,在校正批次效应后,将两个数据集GSE108109和GSE104948合并为一个单一队列进行进一步分析。接下来,使用WGCNA分析在ANCA-GN中寻找共表达基因模块。在排除平均表达量小于1的基因并保留方差最大的25%基因后,对27个对照样本和37个AAV样本进行聚类。为了与无标度网络一致,选择了β = 9的软阈值(图2A)。使用聚类高度阈值0.25合并强相关的模块,并显示在聚类树下方(图2B)。鉴定出与ANCA-GN相关的三个模块(图2C)。为了过滤出与NETosis最相关的模块,将这三个模块的基因与已报道的NETs基因集进行交集运算,Wayne图显示黄色模块与NETs的交集最多(图2E)。通过计算模块与临床特征之间的相关性,发现黄色模块与ANCA-GN组之间存在显著正相关(r=0.79,p=3e-12)。此外,在黄色模块的散点图中还发现GS与MM之间存在显著相关性(图2D)。因此,黄色模块被确定为与ANCA-GN相关的最相关模块。从图2F可以看出,ANCA-GN组与对照组之间的SIGLEC5表达没有差异,最终纳入研究的有18个DE-NETs。


b46f97fba9e26efe3851a7b41b382603.jpeg

图2 WGCNA模块的构建


2. DE-NETs的功能分析

为了阐明DE-NETs在ANCA-GN中的潜在生物学意义,进行了GO富集分析和KEGG富集分析。在GO富集分析中,主要富集了“白细胞介素-6产生的正调节”、“细胞因子产生的正调节”和“白细胞介素-8产生的正调节”等生物过程(BP),主要富集了“分泌颗粒膜”、“三级颗粒”和“富含ficolin-1的颗粒”等细胞组成(CC),而“水解酶活性,作用于糖基键”、“模式识别受体活性”和“NAD+核苷酸酶活性”等主要富集了分子功能(MF)(图3A)。在KEGG富集分析中,主要富集了“中性粒细胞外细胞陷阱形成”、“Toll样受体信号通路”和“金黄色葡萄球菌感染”(图3B),这表明炎症因子产生和Toll样受体信号通路可能参与了ANCA-GN中NETosis的形成。

4cda8527f7810809f4ca3086d6e9f3d1.jpeg

图3 DE-NETs的功能分析


3. NETosisScore模型的构建和验证

为了确认ANCA-GN中NETosis的表达模式,作者将来自两个ANCA-GN队列(GSE104948和GSE108109)的64名患者纳入元队列作为进一步分析的训练集。基于18DE-NETs的中位数ssGSEA得分,构建了一个NETosis Score模型(NETosisScore),并将64名患者分为高风险组和低风险组(图4A)。通过主成分分析(PCA),可以清楚地区分高风险组和低风险组之间的分布(图4B)。从两组的NETosisScore分布图可以看出,随着风险评分的增加,高风险组的患者数量逐渐增加(图4C)。同时,所有的DE-NETs在高风险组和低风险组之间都有显著差异表达(图4D)。训练集和两个独立的验证集(E-MTAB-1994和GSE104954)被纳入以研究NETosisScore模型在区分ANCA-GN患者和对照组方面的能力。在训练集中,如箱线图所示,NETosisScore能够显著区分正常对照组和ANCA-GN患者(p=2)。NETosisScore在ANCA-GN患者中显著高于正常对照组(图4E);训练集中NETosisScore的ROC曲线下面积为0.920(p<0.001)(图4H)。此外,独立数据集验证了NETosisScore模型的区分能力。不仅在E-MTAB-1994数据集(p=0.003)(图4F)和GSE104954数据集(p=0.00017)(图4G)中,ANCA-GN组的NETosisScore显著高于对照组,而且在E-MTAB-1994数据集中ROC曲线的面积为0.797(p<0.001)(图4I),在GSE104954数据集中为0.825(p<0.001)(图4J),这表明NETosisScore模型具有很强的诊断能力,而且ANCA-GN患者可能具有不同的NETosis表达模式。

f23ed5cf76403ab796fd81ca3e5b52b5.jpeg

图4 在ANCA-GN中构建和验证NETosisScore模型


4.&nbsp;两个NETosisScore亚型的免疫特征和生物通路

为了进一步确定高风险组和低风险组之间的免疫特征,作者使用CIBERSORT算法比较了两组之间的免疫细胞浸润丰度。结果显示,与低风险组相比,高风险组的免疫细胞浸润丰度更高。值得注意的是,激活的CD4 T细胞、中央CD4记忆T细胞和效应CD4记忆T细胞在两个亚组中表达差异显著,高风险组的水平更高(图5A)。此外,网络热图还显示NETosisScore与几种CD4 T细胞呈正相关(图5B)。这些数据表明,在NETosisScore模型中,CD4 T细胞与高风险组密切相关,并可能在ANCA-GN的发展中发挥重要作用。对CD4 T细胞亚群的进一步分析表明,在高风险NETosisScore组中,调节性T细胞与之相关性最强,相关系数最高(图5C)。尽管也观察到Th17、Th2和Th1细胞,但与高风险组最强的关联出现在Treg细胞中。总之,研究结果表明,在ANCA-GN中,Treg细胞可能在高风险NETosisScore组中发挥关键作用。这支持了Treg细胞招募巨噬细胞到肾小球的观点,可能对疾病进展产生重要影响。

a39f3a0a4488add403b03a830d0dcb4c.jpeg

图5 NETosisScore亚型的免疫特征和功能富集分析


此外,为了阐明高风险组和低风险组之间的潜在生物学功能,作者使用GSEA富集分析来探索不同亚组之间的生物过程。在高风险组中,主要涉及细胞对生物刺激的反应、白细胞迁移和吞噬作用(图5D),而在低风险组中,主要涉及α氨基酸代谢、单羧酸降解和有机酸降解(图5E),这表明高风险组可能与免疫有关,而低风险组可能与物质代谢有关。为了验证这个推测,作者使用GSVA分析来研究不同亚组之间的生物通路。KEGG富集分析的热图显示,高风险组中富集了B细胞受体信号通路、细胞因子-细胞因子受体相互作用、Toll样受体信号通路和NOD样受体信号通路,而低风险组中则更集中于赖氨酸降解、组氨酸代谢和脂肪酸代谢等其他通路(图5F)。值得注意的是,低风险组在代谢相关通路上富集程度较高,而高风险组主要富集于免疫相关通路,这与GSEA富集分析的结果一致,并证实了上述猜测。以上结果表明,NETosisScore模型能更好地区分ANCA-GN的免疫微环境的异质性,高风险组可能通过免疫相关通路促进ANCA-GN的发展。


5.&nbsp;NETosis相关基因的鉴定

为了在ANCA-GN中确定与NETosis相关的基因(NRGs),使用了一系列的生物信息学算法。为了排除不重要的基因,使用了三种机器学习方法来选择ANCA-GN中的重要基因。首先,使用SVM-RFE算法基于18个DE-NETs筛选出了八个基因(图6A,B)。接下来,应用了随机森林树算法来识别出七个基因(图6C,D),而Lasso回归则确定了10个NRGs(图6E,F)。随后,将三种机器学习算法的结果进行交叉,并确定了最终的六个显著基因作为ANCA-GN的潜在生物标志物(CYBB,ITGB2,ITGAM,TLR2,TLR7和LILRB2)(图6G)。

aed37a2c101deb9b03de98d7931dd13c.jpeg

图6 NET相关基因(NRGs)的鉴定


6.&nbsp;NRGs的免疫特性和相互作用功能分析

为了进一步探索ANCA-GN的免疫特征,作者采用了ssGSEA算法来预测ANCA-GN组和对照组之间的免疫细胞浸润和免疫反应的差异。由于ANCA-GN组和对照组中嗜酸性粒细胞的统计学显著性差异不大,因此作者排除了嗜酸性粒细胞,总共使用了28种免疫细胞浸润或免疫反应来探索ANCA-GN组和对照组之间的免疫特征差异(图7A)。结果显示,与健康对照组相比,ANCA-GN组的CCR、巨噬细胞、T细胞抑制和TIL水平显著升高(图7B)。这些发现表明,这些免疫细胞和免疫反应在ANCA-GN的进展中起着关键作用。此外,作者进一步探索了六个NRG与28种免疫细胞或免疫反应之间的关系。结果发现CCR与CYBB(r=0.922;p<0.001)、ITGB2(r=0.917;p<0.001)、ITGAM(r=0.887;p<0.001)、TLR2(r=0.836;p<0.001)、TLR7(r=0.883;p<0.001)和LILRB2(r=0.906;p<0.001)之间存在强烈的正相关关系。巨噬细胞与CYBB(r=0.886;p < 0.001)、ITGB2(r = 0.913;p < 0.001)、ITGAM(r = 0.862;p < 0.001)、TLR2(r = 0.852;p< 0.001)和TLR7(r = 0.851;p<0.001)呈正相关。T细胞共抑制也与CYBB(r=0.841;p < 0.001)、ITGB2(r = 0.866;p < 0.001)、ITGAM(r = 0.824;p < 0.001)、TLR7(r = 0.822;p < 0.001)和LILRB2(r = 0.836;p<0.001)呈正相关。肿瘤浸润淋巴细胞(TIL)与CYBB(r=0.889;p < 0.001)、ITGB2(r = 0.878;p< 0.001)、ITGAM(r = 0.848;p < 0.001)、TLR7(r = 0.823;p < 0.001)和LILRB2(r = 0.888;p<0.001)呈正相关。而抗原呈递细胞共抑制与TLR2(r=-0.264;p=0.034)呈负相关,B细胞也与ITGB2(r = -0.286, p = 0.021)、ITGAM(r = -0.360, p = 0.003)、TLR2(r = -0.367, p = 0.002)和TLR7(r = -0.259, p = 0.038)呈负相关。


作者的研究结果显示,NRGs与巨噬细胞之间存在强烈关联,而先前的研究表明巨噬细胞、单核细胞和中性粒细胞都参与了NETosis过程。巨噬细胞和单核细胞对炎症和组织损伤起到贡献作用,而中性粒细胞是NETs形成的核心,促进炎症、内皮损伤和血栓形成。为了进一步阐明ANCA-GN样本中NRGs与单核细胞、巨噬细胞和中性粒细胞之间的关系,作者采用了四种算法来评估免疫细胞浸润的丰度:CIBERSORT、xCell、MCPCounter和quanTIseq。与NETosis相关的基因主要包括CYBB、ITGAM、ITGB2、TLR2、TLR7和LILRB2。随后,作者使用热图可视化了免疫细胞浸润与NRGs之间的关系。在所有四种免疫细胞浸润算法中,巨噬细胞与NRGs之间存在显著的相关性,相关系数最高。单核细胞在CIBERSORT和xCell算法中与NRGs呈正相关,但在MCPCounter算法和quanTIseq算法中缺乏显著的相关性。中性粒细胞与NRGs之间的相关性微乎其微。总之,作者的研究结果显示,在ANCA-GN中,巨噬细胞与NRGs的关联比单核细胞和中性粒细胞更强。这些结果表明,在ANCA-GN的进展过程中,这6个NRGs可能通过巨噬细胞释放NETs。需要进一步研究来全面了解这些关系的复杂性以及对ANCA-GN治疗的影响。

cb9425e9c7e9f33babe0714cb8414aa9.jpeg

图7


当作者深入研究NRGs的相关性和潜在功能时,相关性热图显示了六个NRGs之间的强烈正相关,相关值大于0.7,表明这些基因之间存在显著的功能相似性。为了进一步了解NRGs之间的关系,作者使用GeneMANIA数据库构建了一个蛋白质相互作用网络(图7C)。通过GO/KEGG富集分析了26个相关基因。富集的生物过程(BP)包括调节白细胞介素-8的产生、调节白细胞介素-6的产生以及对生物刺激的细胞响应。富集程度最高的细胞组分(CC)包括分泌颗粒膜、质膜的整体组分和三级颗粒。分子功能(MF)类别富集了肽结合、正调控DNA结合转录因子活性以及以氧为受体的NAD(P)H氧化还原酶活性(图7D)。KEGG分析显示,主要富集在Toll样受体信号通路、模式识别受体信号通路和NIK/NF-kappaB信号通路(图7E)。通过比较DE-NETs和NRGs的功能富集通路,作者发现Toll样受体信号通路在两者中都显著富集。


为了深入了解ANCA-GN的分子机制,作者将重点研究Toll样受体信号通路。通过使用KEGG路径视图,作者发现TLR2在这一过程中起着核心作用。通过与肽聚糖(G+)脂蛋白和酶聚糖的相互作用,TLR2通过P13K-AKt信号通路与下游的NF-kappaB结合,促进了IL-1B和IL-6等促炎因子的合成,从而加剧了ANCA-GN的进展。此外,作者还发现TLR2在中性粒细胞外陷阱的形成中起着关键作用。在HMGB1的影响下,氧化低密度脂蛋白、金黄色葡萄球菌和RSVF蛋白与TLR2结合,激活Toll样受体信号通路,导致下游组蛋白乙酰化,最终导致组蛋白解压缩和转录激活。这最终导致NETosis以及对病原体的捕获和消除,同时也引发血栓形成和凝血功能障碍、自身免疫和补体激活。这些发现强调了TLR2在ANCA-GN中的潜在核心作用以及其作为干预靶点的可行性。先前的研究表明,在AAV患者的肾脏中,TLR2和TLR4的表达失调,与越来越多的证据一致,表明Toll样受体(TLRs)与AAV中的免疫反应之间存在密切关系。在AAV患者的肾小球中,与健康对照组相比,TLR2和TLR4的表达显著升高。此外,发现TLR4在肾小球内皮细胞上表达,并与初始血清肌酐水平、总新月体比例和细胞新月体在肾脏标本中呈负相关,突显了TLR4在ANCA-GN中的关键作用。


作者的研究发现,在ANCA-GN患者中,TLR4的表达上调,与正常对照组相比有显著差异。TLR4的ROC曲线下面积为0.748,显示出相当大的诊断潜力。主要受影响的通路包括胆酸代谢的下调和有丝分裂纺锤体、IL6-JAK-STAT3信号通路、炎症反应和PI3K-AKT-mTOR信号通路的上调。免疫细胞浸润分析显示,TLR-4与巨噬细胞和Th1细胞呈显著正相关,与未成熟树突状细胞呈显著负相关。此外,TLR4与血清肌酐(Scr)呈显著正相关,与估计肾小球滤过率(eGFR)呈显著负相关。总之,TLR4在ANCA-GN中似乎发挥着关键作用,因为它在该病情中上调,并具有显著的诊断能力。这种分子参与了几个关键途径,并与特定的免疫细胞浸润以及肾功能相关。这些发现表明TLR4可能是ANCA-GN的重要治疗靶点和预后生物标志物。


7.&nbsp;构建诺莫图并分析临床肾功能

为了探索NRGs在临床实践中的作用,分别探讨了NRGs的临床诊断效能及其与肾功能的关系。首先,基于训练集(GSE104948和GSE108109)中6个NRGs(CYBB、ITGB2、ITGAM、TLR2、TLR7和LILRB2)的表达水平,利用R语言中的“rms”包构建了ANCA-GN的临床诊断模型(图8A)。然后,通过校准曲线分析、决策曲线分析(DCA)和受试者工作特征(ROC)曲线分析评估了该模型的诊断效能。在训练集中,校准曲线显示实际ANCA-GN风险与预测风险之间的最小差异,突出了该模型在预测ANCA-GN方面的实用性(图8B)。DCA显示,当DCA曲线的高风险阈值为0-1时,该模型明显优于其他单个NRGs,表明该模型在预测ANCA-GN的决策效益方面明显优于其他单个NRGs,并且患者可以从该模型中受益(图8C)。此外,ROC曲线显示模型的曲线下面积(AUC)约为0.984,高于任何其他单基因的AUC,表明该模型具有较高的诊断效率(图8D)。独立数据集(GSE108112)用于验证该模型的诊断效能。显然,校准曲线、DCA曲线分析和ROC曲线的AUC结果与训练数据集一致(图8E-G)。因此,基于NRGs的临床诊断模型具有较强的诊断效能,并可为预测ANCA-GN的发生提供有效参考。

46a376cacdab971ffa873e3eff7ccec2.jpeg

图8 构建测量临床肾功能的图表并进行分析


随后,进一步分析了NRGs与临床肾功能之间的相关性。从Nephroseq数据库V5中下载了6个NRGs的表达水平、校正肾小球滤过率(GFR)和血清肌酐(Scr)。Spearman相关分析显示,6个NRGs的表达水平随肾功能下降而增加,并且所有NRGs与GFR呈正相关。其中,TLR2与GFR之间的相关性最强(r = 0.64,p = 2.4e-8)(图8H)。此外,所有6个NRGs与Scr水平呈负相关(图8I),表明NRGs可以预测ANCA-GN的肾损伤严重程度,并可能参与ANCA-GN的肾损伤进展。这些发现表明,NRGs可能作为ANCA-GN预后的潜在生物标志物。


8.&nbsp;NRGs的独立数据集验证

说到作为疾病生物标志物,仅仅在健康组和对照组之间具有差异表达是不够的。这些标志物还必须在诊断方面具有高度的有效性。为了评估这六个NRGs在这方面的适用性,作者进行了分析。作者从训练数据集中的发现表明,这六个NRGs在ANCA-GN组和正常对照组之间的表达差异具有统计学意义(p<0.001),ANCA-GN组的表达水平升高(补充图6A)。独立验证研究的结果进一步支持了这些观察结果,在GSE104954(p<0.001)(图9A)和E-MTAB-1944(p<0.001)(图9B)中检测到了这六个NRGs的差异表达。此外,所有的NRGs在ANCA-GN组中的表达都比对照组高。总之,这六个NRGs满足ANCA-GN组和正常对照组之间差异表达的标准,使它们成为潜在的ANCA-GN生物标志物。

5f5381135c1f1a929a47f79c28281f16.jpeg

图9 独立数据集验证NRGs


接下来,进一步研究了6个NRG在ANCA-GN和正常样本中的诊断价值。在训练数据集中,所有NRG都显示出很高的诊断准确性,这表现在受试者工作特征曲线(ROC曲线)下的面积(AUC)上,所有的AUC都大于0.90。这些NRG包括CYBB(AUC:0.975)、ITGB2(AUC:0.968)、ITGAM(AUC:0.946)、TLR2(AUC:0.920)、TLR7(AUC:0.918)和LILRB2(AUC:0.913)。这一趋势在独立验证集E-MTAB-1944中得到了证实,其中CYBB的AUC为0.989,其次是ITGB2(AUC:0.969)、ITGAM(AUC:0.983)、TLR2(AUC:0.83)、TLR7(AUC:0.953)和LILRB2(AUC:0.908)(图9C-H)。这些发现得到了来自独立数据集GSE104954的结果的进一步支持。这些结果表明,NRG作为ANCA-GN的生物标志物具有很强的潜力,因为它们在区分ANCA-GN和健康样本方面表现出优异的诊断性能。


9.&nbsp;qPCR和免疫组化染色

为了将NRGs的潜在价值转化到临床环境中,作者确定了ANCA-GN患者和健康对照组之间6个NRGs的差异表达水平。作者收集了临床诊断为ANCA-GN的患者和与其年龄和性别匹配的健康个体的全血样本,并使用qPCR定量测定了6个NRGs的表达水平。qPCR结果显示,除了ITGB2外,所有的NRGs在ANCA-GN患者中的表达水平均显著高于健康对照组,并且在ANCA-GN组和健康组之间的表达水平在统计学上具有显著差异(p<0.01)(图10A-F)。这种对6个NRGs mRNA表达的人类水平验证与训练数据集和独立验证集的结果一致,表明NRGs可能作为ANCA-GN进展的潜在标志物。

a22a371f6543402aaadab1f66efe95fc.jpeg

图10 NRGs的qPCR和免疫组化染色验证


随后,作者尝试对ANCA-GN患者和年龄性别匹配的ccRCC患者的肾脏切片以及相邻非肿瘤组织进行NRGs(CYBB,ITGB2,ITGAM,LILRB2,TLR2和TLR7)的免疫组化(IHC)染色。IHC染色结果显示,CYBB在ANCA-GN中呈中度阳性(得分=2+),主要分布在肾小球内皮细胞和肾小管上皮细胞中。有趣的是,尽管ITGB2在qPCR中没有显示出显著的差异表达,但在ANCA-GN中呈中度阳性(得分=2+)。这种差异可能是由于样本量较小,无法完全反映实际差异,需要使用更多样本进行验证。相反,IHC染色可以观察到细胞内蛋白质的定位,可能富集在炎症区域的肾小球和肾小管内皮细胞表面,导致中度阳性。ITGAM在ANCA-GN中呈强阳性,主要分布在肾小球和肾小管内皮细胞中。TLR2和TLR7染色在ANCA-GN中呈强阳性(得分=3+),主要分布在肾小管上皮细胞和肾小球内皮细胞中。LILRB2染色在ANCA-GN中呈现中度阳性(得分=2+),主要在肾小球和肾小管细胞中(图10G)。该实验证实了高通量测序数据和qPCR结果的一致性,表明NRGs在ANCA-GN中显著过表达,并可能在ANCA-GN中发挥重要作用。


总结

总之,作者的研究通过全面的生物信息学分析系统地探索了AAV的潜在机制。同时,本研究还筛选出了一些关键基因和重要途径,这可能有助于在ANCA-GN中寻找新的生物标志物或治疗靶点。为了更有针对性地探索ANCA-GN的病理生理机制,未来需要进行进一步的动物和临床分子生物学实验来验证本研究的结果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信风暴

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值