参考自《R Graphics Cookbook》
箱线图:箱子和线的组合;语法:geom_boxplot()。
箱线图的箱子长度代表前25%分位到75%分位的数据分布(四分之一分位数到四分之三分位数),箱子中的横线为中位数;
箱子外的线段(箱子的虚)表示两端数据的范围,最大不能超过1.5倍的四分之一分位数到四分之三分位数的距离;
如果不超过这个距离,最远点是多少就画多长的线段,若有极端值超过,则画1.5倍距离的线段和离群点。
library(ggplot2)
library(MASS)
#映射离散变量给x(此处直接变量转化因子变量),映射连续变量给y
ggplot(birthwt, aes(x = factor(race), y = bwt)) +
geom_boxplot()
#改变箱线图宽度,默认大概是0.8
ggplot(birthwt, aes(x = factor(race), y = bwt)) +
geom_boxplot(width = .5)
#改变箱线图离群点的样式,默认size是1,shape是16
ggplot(birthwt, aes(x = factor(race), y = bwt)) +
geom_boxplot(outlier.size = 1.5, outlier.shape = 21)
#若要生成单个箱线图,则需要给x映射一个任意常数, 然后去除x轴刻度和轴标签(一般不会生成单个箱线图)
#但表明在ggplot中映射给x一个常数,是可行的
ggplot(birthwt, aes(x = 1, y = bwt)) +
geom_boxplot() +
scale_x_continuous(breaks = NULL) +
theme(axis.title.x = element_blank( ) )