运用R语言绘制火山图
一、概念
火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。火山图可以方便直观地展示两个样本间基因差异表达的分布情况。通常横坐标用log2(fold Change) 表示,差异大的基因分布在两端,纵坐标用-log10 (pvalue) 表示,T检验显著性P值的负对数。通常差异倍数越大的基因T检验越显著,所以左上角和右上角的数据点往往更具有生物学研究意义。这类图像往往呈现类似火山爆发的样子,于是就被叫做“火山图” (volcano plot) 。
二、绘图
#加载包
> library(ggplot2)
> library(ggrepel)
#输入数据
> content <- read.table(file="volcano.txt",sep="\t",header=TRUE)
#查看数据
> head(content)
ID P.value log2.FC. VIP
1 1.11_464.0987m/z 0.004160172 -8.521750 2.5515021
2 0.78_172.0607m/z 0.032854606 -7.168932 0.7624408
3 0.79_174.0763m/z 0.031975671 -6.884066 1.5718893
4 1.16_292.0832m/z 0.012697770 -5.158595 0.8458313
5 0.79_152.0569m/z 0.042376164 -