入门letter数据集_python数据分布型图表箱形图系列大数据集箱形图

9c1cd7929b3e8161732f653e0bfaabe7.png

大数据集的箱形图

  • 在使用大数据集(n=10000-100000)可以提供更加精准的四分位数之外的数据估计;

  • 同时可以展示大量的异常值;

letter-value箱形图

  • 不仅能展示四分位之外的数据分布信息;

  • 还能显示异常值的分布情况;

  • 在箱形图[中值median(M)和四分位数fourths(F)]的基础上,往两端延伸,增加箱形的个数:1/8eigths(E),1/16sixteenths(D)........ 直到估计误差增大到一定的阀值;

箱形图优点:

  • 能够比带误差线的柱形图更好展示数据的分布情况;

箱形图缺点:

  • 无法识别多峰分布情况;

绘制大数据集的箱形图

  • Seaborn包的boxenplot()函数绘制大数据集箱形图

不同数据量的正态分布大数据集箱形图

import pan

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值