突变瀑布图及亚型突变瀑布

基于某些基因将组织测序数据分亚型后,可以观察不同亚型的突变情况,不同亚型可能存在不同的突变负荷或高度突变基因。

需要准备的文件只有一个,格式如下:

这是我再TCGA胃癌(STAD)数据库中分析的风险模型,将胃癌数据分成了高低风险,这个数据存成csv格式即可。

下面开始运行代码,需要下载TCGAbiolinks软件包,基于此R包,可以用R软件下载TCGA中的任何数据,唯一的缺点就是运行比较慢,下面我们下载TCGA中的STAD突变数据:

rm(list = ls())
BiocManager::install("TCGAbiolinks",ask = F,update = F)
library(TCGAbiolinks)
library(maftools)

mut <- GDCquery_Maf(tumor = "STAD",pipelines = "mutect2") #下载突变数据
dim(mut)

由于TCGA不同的癌症有不同的缩写形式,例如膀胱癌是BLCA,肺腺癌是LUAD,因此如果要下载哪个癌症的突变数据,建议使用TCGA官方的缩写形式。运行到此处会显示下载进度,此处需要等待几十分钟。

 

下载完以后,可以查看一下STAD突变数据中的样本名字:

mut$Tumor_Sample_Barcode[1]## 查看样本名

 

可以看到,STAD突变数据的样本名字和我的风险亚型数据的样本名字不一样,因此需要改成同样的名字,我们可以使用substr和gsub进行名字缩短和替换:

mut$Tumor_Sample_Barcode <- substr(mut$Tumor_Sample_Barcode,1,12)
mut$Tumor_Sample_Barcode <- gsub("-",".",mut$Tumor_Sample_Barcode)

然后下载亚型文件:

rt <- read.csv("BLCA_cluster.csv",header = T,sep = ",")
head(rt)

 下面基于亚型文件提取高风险和低风险亚型的突变数据:

mut.High <- mut[(mut$Tumor_Sample_Barcode %in% rt$X[rt$Cluster=="Highrisk"]),]
###   %in%   判断前面一个向量是否在后面一个向量中存在,返回布尔值
mut.Low <- mut[(mut$Tumor_Sample_Barcode %in% rt$X[rt$Cluster=="Lowrisk"]),]
dim(mut.High)
dim(mut.Low)

注意此处美元符后面列名的选择,第一个红框选择的是亚型文件第一列,第二个红框选择亚型文件第二列:

 下面开始做瀑布图,下载maftools包,并加载maftools包,读取数据:

library(maftools)
maf.High <- read.maf(maf=mut.High,isTCGA=T)## 读取高风险亚型的突变数据
maf.Low <- read.maf(maf = mut.Low,isTCGA = T)## 读取低风险亚型的突变数据
maf.all <- read.maf(maf = mut,isTCGA = T)## 读取总的样本突变数据

下面设置颜色,人种等信息,这里的代码不需要修改:


col = RColorBrewer::brewer.pal(n = 10, name = 'Paired')
names(col) = c('Frame_Shift_Del','Missense_Mutation', 'Nonsense_Mutation', 'Frame_Shift_Ins','In_Frame_Ins', 'Splice_Site', 'In_Frame_Del','Nonstop_Mutation','Translation_Start_Site','Multi_Hit')

#人种
racecolors = RColorBrewer::brewer.pal(n = 4,name = 'Spectral')
names(racecolors) = c("ASIAN", "WHITE", "BLACK_OR_AFRICAN_AMERICAN",  "AMERICAN_INDIAN_OR_ALASKA_NATIVE")

下面开始绘制总的瀑布图,代码及图片如下:

oncoplot(maf = maf.all,
         colors = col,#给突变配色
         top = 20)

绘制高风险亚型瀑布图,代码及图片如下:

oncoplot(maf = maf.high,
         colors = col,#给突变配色
         top = 20)

绘制低风险瀑布图,代码及图片如下:

oncoplot(maf = maf.low,
         colors = col,#给突变配色
         top = 20)

 

如果不同亚型患者的预后不同,最高突变率的基因和突变负荷也会存在差异。如上述图中,除了TNN和TP53外,后面的基因排名及突变率发生了明显不同。

  • 6
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

楷然教你学生信

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值