虽然直方图是柱状图的一种(毕竟乍眼看都是很多柱子的样子),但是其实它俩一个喜欢数多少,一个喜欢比大小。
直方图展示数据分布
直方图(Histogram)是一种可视化在连续间隔,或者是特定时间段内数据分布情况的图表,经常被用在统计学领域。简单来说,直方图描述的是一组数据的频次分布,例如把年龄分成“0-5,5-10,……,80-85”17个组,统计一下中国人口年龄的分布情况。直方图有助于我们知道数据的分布情况,诸如众数、中位数的大致位置、数据是否存在缺口或者异常值。
(注:众数是指一组数据中出现次数最多的数据值,众数可能是一个数,但也可能是多个数。中位数是指可将数值集合划分为相等的上下两部分的数。)
根据数据分布状况不同,直方图展示的数据有不同的模式,包括对称单峰、偏左单峰、偏右单峰、双峰、多峰以及对称多峰。
直方图的百年历史
一般认为,直方图最早是由数理统计学家Karl Pearson引入的,1891年他在文章“Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material”中,运用直方图展示了均质材料中的偏差。