原标题:30天学会R DAY19:ggplot2:组间比较如何标注P值
以下是过去各讲设计数据整理的内容
第19天 ggplot2数据可视化(2)数据组间比较绘图方法
在医学数据进行统计分析时,经常需要借助图形来表达均数、标准误、率、构成比、P值,标签等指标,本章将对医学数据组间比较绘图方法。
在进行绘图之前,我们先导入数据,并对数据进行前处理。
elder1
elder2
newdata
newdata$sex
newdata$sleep
newdata
一、定量数据组间比较
医学数据中,最为常见的就是对两组或多组的定量、定性数据进行比较,结果的表达有均数±标准差,或者是中位数(四分位间距),这两种形式的结果可以分别用误差条图、箱式图进行表达。
1、正态分布数据比较(误差条图)
如果我们对不同性别的收缩压(SBP)进行分析,假设符合正态性和方差齐性,进行t检验后,可用误差条图表示各组间的均数,标准误,可信区间及P值。
在利用ggplot2进行之前,对数据的格式进行转化是非常重要,与其我们苦苦挣扎着在ggplot2里直接对原变量进行绘图,还不如把原变量数据进行转化生成新的变量,以适应ggplot2绘图功能。系统自带的dplyr包可以很好的帮助我们实现这一目的。
对数据格式进行转化
library(dplyr) #加载dplyr包
by_sex
newdata1
newdata1
View(newdata1)
将原数据整理成绘图所需要的数据
下图就是绘制的不同性别收缩压的误差条图,有点难看,误差线太小,没办法,数据样本量大了,标准误自然就小了,看到的误差区间就很小,大家将就着看吧。
那么这个图要怎么绘制呢,我一步一步给大家讲解。
首先,我们先得加载ggplot2包,这个是必需的。
library(ggplot2) #加载ggplot2包
1)绘制不同性别血压值的条形图
ggplot(data = newdata1, aes(x = sex, y = mean