用R绘制箱线图
1.箱线图介绍
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。
箱线图能够提供某变量分布以及异常值的信息,其通过分位数来概括某变量的分布信息从而比较不同变量的分布。
其形状如下:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oJnABhUF-1617280686848)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210401101137745.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7RrDaUsR-1617280686849)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210401101100035.png)]
箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。
2.工具
- boxplot函数
boxplot(变量,range=1.5, width=NULL, varwidth = FALSE, notch = FALSE, names, plot = TRUE, border = par(“fg”), log = “”, pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, outline=TRUE, add=FALSE, at=NULL, col=“blue”, main=“主标题名”,xlab=“x轴变量名”,ylab=“y轴变量名”)
部分参数意义
range=1.5: 即1.5倍IQR,超过上下界被视为异常值。
outline=TRUE:标识异常值。
add=TRUE:添加一个新变量的箱线图到已有的箱线图中。
at: 指定添加箱线图的位置。
varwidth: 逻辑值,控制箱体的宽度, 只有图中有多个箱体时才发挥作用,默认为FALSE, 所有箱体的宽度相同,当其值为TRUE时,代表每个箱体的样本量作为其相对宽度。
notch: 逻辑值,如果该参数设置为TRUE,则在箱体两侧会出现凹口。默认为FALS