欢迎关注”生信修炼手册”!
对于任意的表达量数据,定量加差异分析都是一套经典的组合拳。当我们想要展示特定基因的组间差异结果时,下面这种图表就派上了用场

横坐标为基因,纵坐标是基因表达量,每一组的表达量采用了箱体图的形式来展现,当然也可以换成小提琴图等其他描述总体分布的可视化方式。对于每一个基因,通过并列的两组箱体来定性的展示两组间的分布差异,而图中星号则表示差异分析的p值,定量展示差异的显著性,通过这种图表,可以直观的展示差异分析结果。
对于这样的图表,推荐使用ggpubr这个R包,这个包是ggplot2的一个扩展,所以其画图的语法遵循ggplot2的定义,简单理解就是每一个属性都对应数据框的每一列,所以我们首要任务是构建一个绘图用的数据框,这个数据框的每一列对应图中的一个元素
1. 第一列,对应x轴,即基因名称
2. 第二列,对应y轴,即基因表达量
3. 第三列,对应样本
3. 第四列,对应图例中的不同颜色,即样本分组
数据准备的代码如下
# 1.基因表达量数据
# 纯文本文件,每一行为基因,每一列为样本
> data <- read.table("data.txt", header = T, sep = "\t", row.names = 1)
> data[1:5, 1:5]
GSM3076582 GSM3076584 GSM3076586 GSM3076588 GSM3076590
PNP 7.123107 7.115196 7.103920 7.377837 6.960771
PTGIS 2.

最低0.47元/天 解锁文章
1529

被折叠的 条评论
为什么被折叠?



