ggplot2中做箱线图及其上下线
- 使用ggplot2制作箱线图
首先,我们加载ggplot2的包,然后使用geom_boxplot函数画箱线图。
library(ggplot2)
p = ggplot(data=train.data.raw)
p+geom_boxplot(aes(x=Revenue,y=Administrative,group=Revenue,fill=factor(Revenue)),color="black")
结果会是这样的:
-
调整横纵轴坐标长度
如果需要调整横纵轴坐标长度,可以 +xlim 或 +ylim。
比如这样子:p + geom_boxplot(aes(x=Revenue,y=Administrative,group= Revenue,fill=factor(Revenue)),color="black") + ylim(0,20)
结果如下所示:
当然,这样是会在显示上屏蔽掉超出ylim界限的点。但有些时候个别数据过大导致整个箱线图过小时还是需要剔除掉这个别的离群点数据。
-
为箱线图增加上下横线
看到上图中,箱线图是没有上下横线的,这不符合平时的习惯,所以我们给它加上上下横线。
这里我们使用+stat_boxplot(geom = “errorbar”,width=0.6,aes(x=Revenue,y=Administrative,group=Revenue))
来实现,需注意的是,这个指令应加在geom_boxplot之前,若在其之后,则画的线会盖在箱线图上面。考虑到美观,应将其加在前面。
具体代码如下:p + stat_boxplot(geom = "errorbar",width=0.6,aes(x=Revenue,y=Administrative,group=Revenue)) + geom_boxplot(aes(x=Revenue,y=Administrative,group=Revenue,fill=factor(Revenue)),color="black") + ylim(0,20)
最终实现图如下: