统计学之怎么看箱线图?

一个针对于连续型变量的统计图:箱线图(boxplot)

解读箱线图最基本的三要素:

1、箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平

2、箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。因此,箱子的宽度在一定程度上反映了数据的波动程度

3、在箱子的上方和下方,又各有一条线。有时候代表着最大最小值,有时候会有一些点“冒出去”。请千万不要纠结,如果有点冒出去,理解成“异常值”就好。

然而,也不是所有连续型变量数据都是适合画箱线图,有些画出来箱线图会变扁,被压得很丑,

这时候就可以取这些数据得对数变换,堪比整容,专治各种不对称分布、非正态分布和异方差现象等。(log2)

所以在处理数据时,如果需要画箱线图,最好还是先将数据进行对数变换,这样,画出来的图就不错!!!



 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值