数据分析介绍之二——单变量数据观察之直方图
点和抖动图很好,因为它们很简单。 然而,它们既不漂亮也不直观,最重要的是,它们难以从图中读出定量信息。 特别是,如果我们处理较大的数据集,那么我们需要一个更好的图形类型,如直方图。
一、直方图
为了形成直方图,我们将值的范围划分成一组“仓”,然后计算落入每个仓的点数(有时称为“事件”)。 然后,我们将每个bin的事件计数作为bin的位置的函数。
再次,让我们来看一个例子。 以下是包含针对Web服务器或数据库的查询的响应时间(以毫秒为单位)的文件的开头。 与前面的例子相比,这个数据集相当大,包含了1000个数据点。
452.42
318.58
144.82
129.13
1216.45
991.56
1476.69
662.73
1302.85
1278.55
627.65
1030.78
215.23
44.50
图2-2显示了该数据集的直方图。 我将横轴分为60个50毫秒宽度的箱