话说,学习R语言,对于很多人来说很困难,也很眼馋。
眼馋是因为我们经常百度或者公众号介绍用R语言绘制一些漂亮的统计图,复现文章,复现那个文章的。
困难时因为,哪怕别人给你介绍了一堆方法,等我们使用自己的数据的时候,发现还是这不会,那不会的。
怎么样掌握这些代码呢?或者说怎么样把公开的代码套到自己的数据上,形成漂亮的统计图表呢?
郑老师想了一个办法!
先帮助各位将数据分析出来,并实时显示分析该数据的源代码!结合风暴统计平台,目前可以实现以下三个功能:
(1)菜单式操作实现统计小白无法用R语言绘制箱式图
(2)提供R语言代码以复现,确认结果的一致性与可靠性!
(3)推动R语言学习,帮助各位掌握复杂的R语言过程。
下面为大家进行详细的实操介绍!
一、实操案例介绍
数据集来源于R自带MASS数据集birthwt,这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。本次复现涉及的变量说明如下。
二、R语言实操
1.安装加载R包
install.packages("survival")
install.packages("ggplot2")
install.packages("ggpubr")
library(survival)
library(ggplot2)
library(ggpubr)
2.导入数据
由于用到的是MASS中的数据集,因此也要先加载一下MASS包。
library(MASS)
data(birthwt)
3.分类变量因子化
如果跳过这一步,可能导致绘图失败哦!
birthwt$race <- as.factor(birthwt$race)
4.绘制箱式图
birthwt,"race","bwt"的位置分别对应数据集,分类变量,定量变量。其他主要参数有fill指箱子的填充色,color选入分组变量,palette指定箱线图的配色。method很重要!根据不同的数据类型,选择不同的方法,比如两组正态选用t.test,两组偏态选用wilcox.test,两组及以上偏态数据用kruskal.test,两组及以上正态数据用anova.
Boxplot1<- ggboxplot(birthwt,"race","bwt",
add = " NULL",rug = TRUE,
color = "race",fill = NULL,width = 0.4,
palette = "npg", size = 0.4)
Boxplot<- Boxplot1+stat_compare_means(method = "kruskal.test",label.x.npc = "center")
Boxplot
接下来就得到了完整的箱式图!
如果想要增加一些元素,比如绘制抖动点式箱线图,只需要将“add = " NULL"”修改为“add="jitter"”,其他不变,运行后,就可以得到下面的图啦!
三、风暴统计平台实操
关于网站实操细节,之前的文章中有详细介绍,这里我们直接介绍R语言代码部分!
1.选入变量
最关键的就是分析变量与分组变量,这里我们选入的分组变量是一个多分类变量。
2.比较方法的选择
这里我们没有选择亚组变量,因此只关心整体比较方法就好。如果选择了亚组变量则需要多关注多组间比较时的组间比较方法。
完成后,右侧直接生成箱式图!
现在直接查看代码,与最初的R语言操作代码完全一样。
如果需要制作抖动图,就在左侧选择添加“jitter”。
右侧图像与代码也会同步更新!
更多的参数设置,如果你有需要,你们可以提出来,后台会继续完善!本周更新到此结束,欢迎各位多提提意见,新的更新,下周再见!