R之箱线图

# 
# 箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值、下四分位数(第25百分
# 位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值,描述了连续型变量
# 的分布。箱线图能够显示出可能为离群点(范围±1.5*IQR以外的值,IQR表示四分位距,即上
# 四分位数与下四分位数的差值)的观测。例如:


boxplot(mtcars$mpg,main="Box plot",ylab="Miles per Gallon")


boxplot.stats(mtcars$mpg)
# 
# 举例来说,在我们的车型样本中,
# 每加仑汽油行驶英里数的中位数是19.2,50%的值都落在
# 了15.3和22.8之间,最小值为10.4,最大值为33.9。我是
# 如何从图中如此精确地读出了这些值呢?
# > boxplot.stats(mtcars$mpg)
# $stats
# [1] 10.4 15.3 19.2 22.8 33.9
# 
# $n
# [1] 32
# 
# $conf
# [1] 17.1 21.3
# 
# $out
# numeric(0)


#使用并列箱线图进行跨组比较

# 箱线图可以展示单个变量或分组变量。使用格式为:

boxplot(formula,data=dataframe)

# 其中的formula是一个公式,dataframe代表提供数据的数据框(或列表)。一个示例公式为y ~
#   ~A,这将为类别型变量A的每个值并列地生成数值型变量y的箱线图。公式y ~ A*B则将为类别型
# 变量A和B所有水平的两两组合生成数值型变量y的箱线图。
# 添加参数varwidth=TRUE 将使箱线图的宽度与其样本大小的平方根成正比。参数
# horizontal=TRUE可以反转坐标轴的方向。

# 
# 在以下代码中,我们使用并列箱线图重新研究了四缸、六缸、八缸发动机对每加仑汽油行驶
# 的英里数的影响。结果如图6-12所示。

boxplot(mpg~cyl,data = mtcars,main="Car Milesage Data",
        xlab="Number of Cyliders",ylab="Miles per Gallon")



# 图中可以看到不同组间油耗的区别非常明显。同时也可以发现,六缸车型的每加仑汽
# 油行驶的英里数分布较其他两类车型更为均匀。与六缸和八缸车型相比,四缸车型的每加仑汽油
# 行驶的英里数散布最广(且正偏)。在八缸组还有一个离群点。
# 箱线图灵活多变,通过添加notch=TRUE,可以得到含凹槽的箱线图。若两个箱的凹槽互不
# 重叠,则表明它们的中位数有显著差异(Chambers et al., 1983, p. 62)。以下代码将为我们的车型
# 油耗示例创建一幅含凹槽的箱线图




boxplot(mpg~cyl,data = mtcars,main="Car Milesage Data",
        notch=TRUE,varwidth=TRUE,col="red",xlab="Number of Cyliders",ylab="Miles per Gallon")

# 
# 参数col以红色填充了箱线图,而varwidth=TRUE则使箱线图的宽度与它们各自的样本大小
# 成正比。
# 可以看到,四缸、六缸、八缸车型的油耗中位数是不同的。随着汽缸数的减少,
# 油耗明显降低。
# 最后,你可以为多个分组因子绘制箱线图。代码清单6-9为不同缸数和不同变速箱类型的车
# 型绘制了每加仑汽油行驶英里数的箱线图。同样地,这里使用参数col为箱线图进行了着色。
#  
# 注意颜色的循环使用。在本例中,共有六幅箱线图和两种指定的颜色,所以颜色将重复使用三次


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值