数据分析介绍之二——单变量数据观察之直方图

本文介绍了直方图的概念,用于更好地理解大量数据的分布情况。直方图通过划分区间(bin)并计算每个区间的点数,帮助识别数据的集中趋势和分布形状。直方图的质量取决于bin宽度的选择,合适的宽度能展示数据的细节。此外,文章还探讨了直方图的对齐方式对其外观的影响,并提及了归一化直方图和频率多边形等变体。最后,提到了使用Python进行直方图绘制的实践方法。
摘要由CSDN通过智能技术生成

数据分析介绍之二——单变量数据观察之直方图

点和抖动图很好,因为它们很简单。 然而,它们既不漂亮也不直观,最重要的是,它们难以从图中读出定量信息。 特别是,如果我们处理较大的数据集,那么我们需要一个更好的图形类型,如直方图。

这里写图片描述

一、直方图

为了形成直方图,我们将值的范围划分成一组“仓”,然后计算落入每个仓的点数(有时称为“事件”)。 然后,我们将每个bin的事件计数作为bin的位置的函数。

再次,让我们来看一个例子。 以下是包含针对Web服务器或数据库的查询的响应时间(以毫秒为单位)的文件的开头。 与前面的例子相比,这个数据集相当大,包含了1000个数据点。

452.42
318.58
144.82
129.13
1216.45
991.56
1476.69
662.73
1302.85
1278.55
627.65
1030.78
215.23
44.50

图2-2显示了该数据集的直方图。 我将横轴分为60个50毫秒宽度的箱࿰

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值