ggplot2 多个柱状图比较_一条代码完成堆叠柱状图-冲击图的操作-终结版

最新推荐文章于 2023-11-03 10:22:43 发布

weixin_39538451

最新推荐文章于 2023-11-03 10:22:43 发布

阅读量767

点赞数

文章标签： ggplot2 多个柱状图比较 group 最后一条

Editor's Note

生统和生信分析一直是咱们投必得关注的重要内容，虽然我们现在还没有固定的编辑在写，但是也会经常转载我自己和其它几个朋友在其它公众号首发的一些相关干货，今天这篇来源于“微生物生信”，带大家看看堆叠柱状图和冲击图是如何实现的，并且附代码奥~

00. 堆叠柱状图和冲击图介绍

堆叠柱状图用于表征高维数据，例如微生物群落，代谢物组成是一种常见的图表类型，所以使用的次数也非常多，理所应当被封装成函数，一键绘制。

冲击图其实添加了堆叠柱状图之间的连线，这对于柱子之间的横向比较会更加容易一些，同堆叠柱状图互为替代。

01. 一条函数和参数解释

result = barplot(otu = "./otutab.txt",tax = "./taxonomy.txt",map = "./metadata.tsv",j = "Phylum",k= 0.01,rep = 6,axis_ord = "KO-OE-WT",label = FALSE,sd = TRUE)

otu = "./otutab.txt" ：OTU表格

tax = "./taxonomy.txt" ：物种注释文件

map = "./metadata.tsv"：样本分组文件

j = "Phylum" ：设置按照门为分类水平合并OTU，当然可以选择不同的分类水平；j = "Class"；j = "Order"；j = "Family"；j = "Genus"；甚至是OTU，如果你不嫌图例多的话。

k= 0.01：按照丰度过滤掉第丰度的物种，减少图例信息。

rep = 6 ：测定每个处理重复数量。

axis_ord = "KO-OE-WT" ：柱子在x轴额排布顺序。

label = FALSE：是否在柱子上添加标签。

sd = TRUE :是否对堆叠柱状图添加标准

02. 处理本地输出图片外我们还可以通过result提取图片

我设置函数返回图形结果的目的是方便大家根据自己需求修改颜色等图形属性。

#提取堆叠柱状图
p = result[[1]]
p
#提取冲击图
p = result[[2]]
p

3. 附：主函数

注意一下几个包，大家都看看装上没有，务必都安装后在运行，方可成功。

library(phyloseq)
library(tidyverse)
library(vegan)
library(reshape2)
library("plyr")
library(ggalluvial)
library(ggplot2)

barplot = function(otu = "./otutab.txt",tax = "./taxonomy.txt",map = "./metadata.tsv",j = "Phylum",k= 0.01,rep = 6,axis_ord = "KO-OE-WT",label = TRUE){
library(phyloseq)
library(tidyverse)
library(vegan)
library(reshape2)
library("plyr")
library(ggalluvial)
library(ggplot2)
axis_order = strsplit(basename(axis_order), "-")[[1]]#导入otu表格
otu = read.delim(otu,row.names = 1)
head(otu)
otu = as.matrix(otu)
str(otu)#导入注释文件
tax = read.delim(tax,row.names = 1)
head(tax)
tax = as.matrix(tax)# taxa_names(tax)#导入分组文件
map = read.delim(map,row.names = 1)
head(map)# #导入进化树# tree = read.tree("./otus.tree")# tree
ps <- phyloseq(otu_table(otu, taxa_are_rows=TRUE),
sample_data(map) ,
tax_table(tax)# phy_tree(tree)
)
ps
ps1 = ps
i = ps1
colnames(tax_table(ps1))##这里我们过滤一定阈值的otu，会出现最后堆叠柱状图总体丰度高于100%的情况，这是合理的###########绘制不同分类等级的柱状图
Taxonomies <- i %>%
tax_glom(taxrank = j) %>% # agglomerate at Class level Class
transform_sample_counts(function(x) {x/sum(x)} )%>%# Transform to rel. abundance
psmelt() %>% # Melt to long format
filter(Abundance >= k) %>% # Filter out low abundance taxa
arrange(Phylum)# head(Taxonomies)# dim(Taxonomies)
colbar <- dim(unique(select(Taxonomies, one_of(j))))[1]
colors = colorRampPalette(c( "#CBD588", "#599861", "orange","#DA5724", "#508578", "#CD9BCD",
"#AD6F3B", "#673770","#D14285", "#652926", "#C84248",
"#8569D5", "#5E738F","#D1A33D", "#8A7C64","black"))(colbar)# mi = colorRampPalette(c( "#CBD588", "#599861", "orange","#DA5724", "#508578", "#CD9BCD",# "#AD6F3B", "#673770","#D14285", "#652926", "#C84248",# "#8569D5", "#5E738F","#D1A33D", "#8A7C64","black"))(colbar)##
Taxonomies$Abundance = Taxonomies$Abundance * 100
Taxonomies$Abundance = Taxonomies$Abundance/rep# head(Taxonomies)#按照分组求均值
colnames(Taxonomies) <- gsub(j,"aa",colnames(Taxonomies))
by_cyl <- group_by(Taxonomies, Group,aa)
zhnagxu2 = dplyr :: summarise(by_cyl, sum(Abundance))#colnames(zhnagxu2) = c("group", j,"Abundance")# head(zhnagxu2)##确定因子，这里通过求和按照从小到大的顺序得到因子##长变宽# head(Taxonomies)
Taxonomies2 = dcast(Taxonomies,aa ~ Sample,value.var = "Abundance")
head(Taxonomies2)
Taxonomies2[is.na(Taxonomies2)] <- 0
aa = Taxonomies2# head(aa)
n = ncol(aa)#增加一行，为整列的均值，计算每一列的均值，2就是表示列
aa[n+1]=apply(aa[,c(2:ncol(aa))],1,sum)
colnames(aa)[n+1] <- c("allsum")# str(aa)
bb<- arrange(aa, allsum)# head(bb)
bb = bb[c(1,ncol(bb))]
cc<- arrange(bb, desc(allsum))# head(cc)##使用这个属的因子对下面数据进行排序
head(zhnagxu2)
colnames(zhnagxu2) <- c("group","aa","Abundance")
zhnagxu2$aa = factor(zhnagxu2$aa,order = T,levels = cc$aa)
zhnagxu3 = plyr::arrange(zhnagxu2,desc(aa))# head(zhnagxu3)##制作标签坐标，标签位于顶端# Taxonomies_x = ddply(zhnagxu3,"group", transform, label_y = cumsum(Abundance))# head(Taxonomies_x )#标签位于中部
Taxonomies_x = ddply(zhnagxu3,"group", transform, label_y = cumsum(Abundance) - 0.5*Abundance)
head(Taxonomies_x,20 )
Taxonomies_x$label = Taxonomies_x$aa#使用循环将堆叠柱状图柱子比较窄的别写标签，仅仅宽柱子写上标签
for(i in 1:nrow(Taxonomies_x)){if(Taxonomies_x[i,3] > 3){
Taxonomies_x[i,5] = Taxonomies_x[i,5]
}else{
Taxonomies_x[i,5] = NA
}
}##普通柱状图
p4 <- ggplot(Taxonomies_x , aes(x = group, y = Abundance, fill = aa, order = aa)) +
geom_bar(stat = "identity",width = 0.5,color = "black") +
scale_fill_manual(values = colors) +
theme(axis.title.x = element_blank()) +
theme(legend.text=element_text(size=6)) +
scale_y_continuous(name = "Abundance (%)")+
scale_x_discrete(limits = axis_order)if (label == TRUE) {
p4 = p4 +
geom_text(aes(y = label_y, label = label ),size = 4,fontface = "bold.italic")
}# print(p4)# install.packages("ggalluvial")
p4 = p4+theme_bw()+
scale_y_continuous(expand = c(0,0))+
theme(
panel.grid.major=element_blank(),
panel.grid.minor=element_blank(),
text=element_text(face = "bold"),
plot.title = element_text(vjust = -8.5,hjust = 0.1),
axis.title.y =element_text(size = 20,face = "bold",colour = "black"),
axis.title.x =element_text(size = 24,face = "bold",colour = "black"),
axis.text = element_text(size = 20,face = "bold"),
axis.text.x = element_text(colour = "black",size = 14,),
axis.text.y = element_text(colour = "black",size = 14),
legend.text = element_text(size = 15)#legend.position = "none"#是否删除图例
)
p4
FileName1 <- paste("./a2_",j,k,"_bar",".pdf", sep = "")
ggsave(FileName1, p4, width = 12, height =8 )##柱状图冲击图#stratum定义堆叠柱状图柱子内容，以weight定义柱子长度，alluvium定义连线
head(Taxonomies_x )
cs = Taxonomies_x $aa# head(cs)# as.factor(Taxonomies_x $Genus)# cs = as.character(Taxonomies_x $Genus)# cs1 = as.factor(cs)
cs1 = cs#提取真正的因子的数量
lengthfactor = length(levels(cs1))#提取每个因子对应的数量
cs3 = summary (as.factor(cs1))
cs4 = as.data.frame(cs3)
cs4$id = row.names(cs4)#对因子进行排序
df_arrange<- arrange(cs4, id)#对Taxonomies_x 对应的列进行排序
Taxonomies_x1<- arrange(Taxonomies_x , aa)
head(Taxonomies_x1)#构建flow的映射列Taxonomies_x
Taxonomies_x1$ID = factor(rep(c(1:lengthfactor), cs4$cs3))#colour = "black",size = 2,,aes(color = "black",size = 0.8)
p3 = ggplot(Taxonomies_x1,
aes(x = group, stratum = aa, alluvium = ID,
weight = Abundance,
fill = aa, label = aa)) +
geom_flow(stat = "alluvium", lode.guidance = "rightleft",
color = "black",size = 0.2,width = 0.3,alpha = .2) +
geom_bar(width = 0.45)+
geom_stratum(width = 0.45,size = 0.2) +#geom_text(stat = "stratum", size = 3,family="Times New Roman",fontface = "bold.italic") +#theme(legend.position = "none") +
scale_fill_manual(values = colors)+#ggtitle("fow_plot")+
scale_x_discrete(limits = axis_order)+
geom_text(aes(y = label_y, label = label ),size = 4,fontface = "bold.italic")+
labs(x="group",
y="Relative abundancce (%)",
title="")
# p3
if (label == TRUE) {
p3 = p3 +
geom_text(aes(y = label_y, label = label ),size = 4,fontface = "bold.italic")
}
p3 =p3+theme_bw()+
scale_y_continuous(expand = c(0,0))+
#geom_hline(aes(yintercept=0), colour="black", linetype=2) +
#geom_vline(aes(xintercept=0), colour="black", linetype="dashed") +
#scale_fill_manual(values = mi, guide = guide_legend(title = NULL))+
theme(
panel.grid.major=element_blank(),
panel.grid.minor=element_blank(),
text=element_text(face = "bold"),
plot.title = element_text(vjust = -8.5,hjust = 0.1),
axis.title.y =element_text(size = 20,face = "bold",colour = "black"),
axis.title.x =element_text(size = 24,face = "bold",colour = "black"),
axis.text = element_text(size = 20,face = "bold"),
axis.text.x = element_text(colour = "black",size = 14),
axis.text.y = element_text(colour = "black",size = 14),
legend.text = element_text(size = 15,face = "bold.italic")
#legend.position = "none"#是否删除图例
)
p3
FileName2 <- paste("./a2_",j,k,"_bar_flow",".pdf", sep = "")
ggsave(FileName2, p3, width = 12, height =8)
return(list(p4,p3))
}

好了本期就到这里了，欢迎大家评论区讨论~

每周一篇研究生科研经验分享，每周五篇文章教你写SCI论文，欢迎关注专栏：

投必得科研软件安装使用手册；投必得：SCI期刊介绍与选择；投必得，教你写论文；投必得统计分析大讲堂；投必得科研生活解忧杂货店

这里是论文编辑润色专家，输出科研干货的投必得，我们下个回答再见ヾ(￣▽￣)Bye~Bye~

weixin_39538451

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ggplot2 多个柱状图比较_一条代码完成堆叠柱状图-冲击图的操作-终结版

Editor's Note生统和生信分析一直是咱们投必得关注的重要内容，虽然我们现在还没有固定的编辑在写，但是也会经常转载我自己和其它几个朋友在其它公众号首发的一些相关干货，今天这篇来源于“微生物生信”，带大家看看堆叠柱状图和冲击图是如何实现的，并且附代码奥~00. 堆叠柱状图和冲击图介绍堆叠柱状图用于表征高维数据，例如微生物群落，代谢物组成是一种常见的图表类型，所以使用的次数也非常多，理所应当...
复制链接

扫一扫