![5303be2f3ee2c92dbb21d5a2d87fbacf.png](https://i-blog.csdnimg.cn/blog_migrate/08b1fa85f5ed2bf6922fd804b192cd06.jpeg)
本文首发于微信公众号 *“ 生信补给站 ” ,期待您的关注!!!*
原文链接:https://mp.weixin.qq.com/s/G-0PtaoO6bYuhx_D_Rlrlw
对于组学数据的分析和展示来说,maftools算是一个宝藏“R包”,可用于MAF格式的组学数据的汇总,分析和可视化展示。
随着癌症基因组学的进步, 突变注释格式 (MAF) 被广泛用于存储检测到的somatic variants。The Cancer Genome Atlas 项目对30多种不同的癌症进行了测序,每种癌症类型的样本量超过200种。maftools-R包能够有效的汇总,分析和可视化MAF格式的文件。
maftools函数主要分为可视化和分析两个模块,其主要功能及简短的描述如下所示,使用时只需读取MAF文件然后降MAF对象传递给所需要的绘图或分析功能即可。
![9288b7bc5c2b9e484b4d4d4403b47384.png](https://i-blog.csdnimg.cn/blog_migrate/6bdc9c68b414e970818f90c98bff4579.jpeg)
本次主要使用R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”。
一、 载入R包,数据
1) 载入maftools包
if (!require("BiocManager"))
install.packages("BiocManager")
BiocManager::install("maftools")
2) 载入数据
通过read.maf
函数读入MAF文件,将各种数据(组学基因突变,拷贝数变异,临床数据,表达数据等)汇总并将其存储为MAF对象。
#TCGA-LAML MAF file (gz)
laml.maf = system.file('extdata', 'tcga_laml.maf.gz', package = 'maftools')
#clinical information (optional)
laml.clin = system.file('extdata', 'tcga_laml_annot.tsv', package = 'maftools')
laml = read.maf(maf = laml.maf, clinicalData = laml.clin)
MAF对象中除了上面基因突变数据和对应的临床数据外,还可以加入拷贝数变异,表达数据等其他数据类型,后面需要的时候会添加。
二、 MAF对象汇总
1) 展示MAF重点变量的summary信息
#Shows sample summry.
getSampleSummary(laml)
#Shows gene summary.
getGe