R语言绘制SCI论文中常见的箱线散点图,并自动进行方差分析计算显著性水平

显著性标记箱线散点图

本篇笔记的内容是在R语言中利用ggplot2,ggsignif,ggsci,ggpubr等包制作箱线散点图,并计算指定变量之间的显著性水平,对不同分组进行特异性标记,最终效果如下。

加载R包

library(ggplot2)
library(ggsignif)
library(ggsci)
library(ggpubr)

载入示例数据

本次使用R语言自带的数据集mpg进行演示,内含不同汽车的相关数据指标。

df <- mpg
head(mpg)

image-20230225112418099

进行绘图

ggplot(df,aes(class,hwy))+
  geom_boxplot(aes(fill=class))

image-20230225112207918

首先绘制出一张普通的箱线图,填充颜色与车型分类class变量有关,然后在其基础上添加图层。下面检测compact\~pickupsubcompact\~suv的相关性,采用t测验,标注信息与横线距离0.1,两端竖线距离0.05

ggplot(df,aes(class,hwy))+
  geom_boxplot(aes(fill=class))+
  geom_signif(
    comparisons = list(
    c("compact","pickup"),
    c("subcompact","suv")
    ), #检测两者之间的差异显著性
    map_signif_level = T, #添加星号标记
    test = "t.test", #检测方法
    vjust=0.1, #标注和横线的距离
    tip_length = 0.05 #两端短竖线的长度
  )

image-20230225112234203

现在可以从图中看出显著性检验的结果,如果想显示p值,只需要将map_signif_level改为F即可,接下来对图片添加注释信息。

ggplot(df,aes(class,hwy))+
  geom_boxplot(aes(fill=class))+
  geom_signif(
    comparisons = list(
    c("compact","pickup"),
    c("subcompact","suv")
    ), #检测两者之间的差异显著性
    map_signif_level = T, #添加星号标记
    test = "t.test", #检测方法
    vjust=0.1, #标注和横线的距离
    tip_length = 0.05 #两端短竖线的长度
  )+
  geom_signif(
    annotations = c("one","two"), #添加注释
    y_position = c(40,42),xmin = c(2,1),xmax = c(5,3) #添加的位置
  )

image-20230225112303985

添加位置信息使用annotations参数,设置信息后利用位置参数进行标注。添加散点图的图层,设置点的颜色和位置,更改箱线图的透明度为70%,最后,再对结果进行主题修改和美化,最终呈现如下效果:

ggplot(df,aes(class,hwy))+
  geom_point(aes(color = class),position = "jitter")+
  geom_boxplot(aes(fill=class),alpha=0.7)+
  geom_signif(
    comparisons = list(
    c("compact","pickup"),
    c("subcompact","suv")
    ), #检测两者之间的差异显著性
    map_signif_level = T, #添加星号标记
    test = "t.test", #检测方法
    vjust=0.1, #标注和横线的距离
    tip_length = 0.05 #两端短竖线的长度
  )+
  geom_signif(
    annotations = c("one","two"), #添加注释
    y_position = c(40,42),xmin = c(2,2),xmax = c(5,3) #添加的位置
  )+
  scale_y_continuous(limits = c(10,48))+
  theme_bw()+
  theme(
    legend.position = "none",
    axis.title = element_text(size = 15,face = "bold"),
    axis.text.x = element_text(size = 12,hjust = 1,angle = 45,color = "black"),
    axis.title.y = element_text(size = 12,color = "black"))

各组显著性比较

载入数据

仍然使用mpg数据集,不过需要注意的是,将class变量变为因子型,因为这样可以在对比过程中按照一定的顺序依次进行。compare_means函数能够对不同变量进行假设检验,com_list变量储存了比较的不同分组,利用for循环生成两两配对的比对列表。

df <- mpg
df$class <- as.factor(df$class)
levels(df$class)
compare <- compare_means(hwy~class,df,method = "t.test")
com_list <- list()
for (i in 1:nrow(compare)){
  com_list[[i]] <- c(compare$group1[i],compare$group2[i])
}

开始绘图

该步骤使用ggplot绘图,方法和之前的一样,不过这里显示了每个变量之间的两两比较结果。

ggplot(df,aes(class,hwy))+
  geom_boxplot(aes(fill=class))+
  stat_compare_means(comparisons = com_list,
                     test = "t.test",
                     step.increase = 0.1,
                     map_signif_level = T)+
  theme_bw()+
  scale_fill_jco()

image-20230225112023290

本文由mdnice多平台发布

  • 1
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信分析笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值