python箱线图重合了怎么办_箱形图以及python实践

本文介绍了箱线图(箱须图)在数据分析中的作用,包括反映数据分布、检测异常值和对比多组数据。通过《统计学》的示例,解释了箱线图各部分的意义。在Python中,利用matplotlib和pandas模块展示了绘制箱线图的步骤,以成绩数据为例,直观展示了箱线图如何揭示数据的集中趋势和异常值。
摘要由CSDN通过智能技术生成

最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析的工作。其中,大家都可能非常清楚条形图、直方图、散点图和曲线图的用处,但是箱形图呢?(或者称为盒须图)。他的意义在哪里呢?在python中又是如何实现的呢?

于是我今天翻开了贾俊平老师的那本《统计学》琢磨了一下午,又参考了各大网友的博客,于是在此作下总结。

箱形图:从字面上理解就是箱子的图,如下图:

箱形图有5个参数:

下边缘(Q1),表示最小值;

下四分位数(Q2),又称“第一四分位数”,等于该样本中所有数值由小到大排列后第25%的数字;

中位数(Q3),又称“第二四分位数”等于该样本中所有数值由小到大排列后第50%的数字;

上四分位数(Q4),又称“第三四分位数”等于该样本中所有数值由小到大排列后第75%的数字;

上边缘(Q5),表述最大值。

第三四分位数与第一四分位数的差距又称四分位间距。

那为什么要引入箱形图呢?这里有篇博文也不错箱形图分析

1.为了反映原始数据的分布情况,比如数据的聚散情况和偏态。看看《统计学》这本书的插图

从图中我们可以直观地看出,箱形图的中位数和上四分位数的间距比较窄的话,对应曲线图,这个间

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值