TCGAplot在线版:输入基因,一键绘制TCGA基因表达与MSI相关性雷达图

本文介绍了TCGA项目及其包含的癌症样本数据,重点讲解了TCGAplotR包,用于泛癌分析和可视化,特别是如何一键绘制基因表达与MSI的相关性雷达图。文章还提到如何通过在线工具简化TCGA数据分析过程,以及MSI在癌症诊断和治疗中的重要性。
摘要由CSDN通过智能技术生成

1.TCGA简介

TCGAThe Cancer Genome Atlas)收集了大量癌症样本的数据,涉及33种不同癌症、超过20000个样本,包括外显子组测序、RNA测序、microRNA 测序、拷贝数变异、蛋白质组和甲基化组,临床信息等数据,研究者可以利用各种生物信息学工具和统计方法来挖掘数据中的有用信息,推动癌症研究的进展。

2.TCGAplot简介

华科同济医院的王雄老师课题组利用TCGA数据库,开发了一个TCGA多组学数据泛癌分析和可视化RTCGAplot[1]。用于泛癌表达以及基因表达与 TMBMSITIME和启动子甲基化之间相关性等分析。

该包整合了配对和未配对的TPM矩阵,MetaTMBMSI、启动子甲基化、免疫细胞比率和免疫评分等数据,极大地方便了我们进行泛癌分析,堪称泛癌分析的“神器”。

3.MSI简介

微卫星不稳定性(Microsatellite instabilityMSI)指在DNA复制过程中,重复的DNA序列片段(即微卫星)增加或减少,引起微卫星长度发生改变,通常由错配修复机制(DNA mismatch repairMMR)功能缺陷引起的。根据程度可分为3类:微卫星高度不稳定性(MSI-highMSI-H),微卫星低度不稳定性(MSI-lowMSI-L)和微卫星稳定(Microsatellite stableMSS)。MSI的检测对于肿瘤的早期诊断、预后判断、化疗敏感性判断以及高危人群的圈定等具有重要意义。例如,在结直肠癌中,MSI-H(微卫星高度不稳定)的患者通常具有较好的预后。此外,MSI状态也与免疫治疗反应相关,MSI-H的肿瘤由于具有更多的新生抗原,可能对PD-1/PD-L1抑制剂等免疫治疗药物有更好的反应。

4.一键在线绘制基因表达与MSI的相关性雷达图

然而,由于TCGAplot R包安装与使用需要相关专业知识。为了更好地帮助大家挖掘TCGA,经与王老师沟通,我们推出了在线版TCGAplot供大家免费使用。

今天,给大家带来的第5个函数:某个基因的表达与MSI的相关性雷达图。

4.1 打开微生信在线作图网站

微生信-在线TCGA泛癌基因表达与微卫星不稳定性(MSI)相关性雷达图

4.2  填写感兴趣的基因,选择参数并提交

将感兴趣的基因symbol粘贴到输入框,由于基因名会更新(见:基因名坑你没商量 -- 有关基因名的坑),所以提交的基因symbol必需在所提供的基因列表里边。例如这里填写基因KLF7,即Kruppel-like factor 7,它是一种转录因子,在生物体内各组织中广泛表达,并参与调控细胞的增殖、分化、再生以及肿瘤发生等重要的生理功能。

我们提供了统计方法,字体等参数供大家选择使用。选择好参数后,点击提交按钮。

4.3 下载图片及数据

由于需要从上万个样品中调取数据并绘图,约40秒后,会出来雷达图。我们提供了pdfsvg两种矢量图,pngtiff两种标量图供大家下载使用。同时也提供了图片对应的数据供下载。

图片说明:

雷达图中最外圈是33种癌症,按字母顺序顺时针排布。名字上的星号表示显著性水平:*表示p<0.05**表示p<0.01***表示p<0.001****表示p<0.0001。这个雷达图包括5个圈,12点位置的刻度是每个圈对应的相关性大小,其中最外圈是0.1,最内圈是-0.4。此图中,距离外圈越近表示正相关越大,距离内圈越近表示负相关性越大。径向的轴对应具体某癌症,以ACC为例,其相关性约为0.04。共33个点连起来围成了一个N边型。这个图的关键在于看准刻度,最大值多少,最小值多少,0点在哪里,有没有星号,N边型的峰和谷对应的都是哪种癌症。

数据说明:

数据包括4列:

CaseidTCGA数据库的ID,由-分割。

Cancer:肿瘤类型

KLF7:该基因的log2(TPM+1)值,由于存储空间及精度原因,这里仅保留了2位小数。

MSI:微卫星不稳定性值

相关性表格:

数据包括3列:

Cancer:肿瘤类型

Corr:相关性

Corr(p):显著性

注:这个表格是根据上个表格重新计算的,精度可能跟原图略有差异,供参考。

5.MSI计算

王老师的GitHub网站提供了MSI源码,数据似乎来自cbioportal。有兴趣的小伙伴可以参考一下:

TCGAplot/rawdata_code/MSI.R at main · tjhwangxiong/TCGAplot · GitHub

参考文献:

[1] Liao C, Wang X. TCGAplot: an R package for integrative pan-cancer analysis and visualization of TCGA multi-omics data. BMC Bioinformatics. 2023 Dec 17;24(1):483. doi: 10.1186/s12859-023-05615-3. PMID: 38105215; PMCID: PMC10726608

微生信助力高分文章,用户167000,谷歌学术3100

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值