箱线图入门,一文看懂箱线图,matplotlib画箱线图

什么是箱线图?

我们画箱线图的目的其实是去查看数据分布的离散程度。

上图将箱线图的重要部分都标出来了。对于箱线图来说,图中会有的要素有:

  • 最大值
  • Q3(大于75%数据的位点)
  • 中位数
  • Q1(大于25%数据的位点)
  • 最小值

Q3与Q1之间的部分叫做IQR(Interquartile Range, 四分位数)。通过查看与比较不同数据的箱线图,我们就可以了解数据分布于离散程度。

使用Matplotlib作图

import matplotlib.mlab as mlab
import matplotlib.pyplot as plt

in_file = "Data7602DescendingYearOrder.csv"
data = pd.read_csv(in_file, engine='python')

ec_2000 = data[data['year']==2000]['ec_count']
ec_2001 = data[data['year']==2001]['ec_count']

_ = plt.boxplot([ec_2000[ec_2000<100], ec_2001[ec_2001<100]])
plt.show()

运行结果: 

代码取出了数据中的两列,并画出箱线图,可以看到两列数据的中位数差不多,但是右边那一列数据的离散程度更大。其中的黑色方块是离群点。

Reference

[1] http://estat.ncku.edu.tw/nsc/flash/topic/graph_stat/base/BoxPlot.html

  • 9
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值