“直方图”工具提供了数据的一元(一个变量)描述。此工具对话框用于显示感兴趣数据集的频率分布并计算汇总统计数据。
频率分布
频率分布是用条形图表示的,该图显示了观察值位于特定区间或组之内的频率。可指定在直方图中使用的等宽类数目。各组中数据的相对比例以各条块的高度表示。例如,以下直方图显示了数据集的频率分布(10 个类)。
![](https://i-blog.csdnimg.cn/blog_migrate/027e51f665d221b5c4d3b1b402e3645a.jpeg)
汇总统计数据
分布的重要功能可通过描述其位置、离散度和形状的统计数据进行概括。
位置的测量值
位置的测量值提供了一个分布的中心和其他部分所处位置的概念。
平均值即为数据的算数平均值。平均值提供分布中心的测量值。
中间值与累积比例 0.5 对应。如果数据以升序排列,50% 的值位于中间值之下,50% 的值位于中间值之上。中间值提供了分布中心的另一个测量值。
第一和第三分位数分别与累积比例 0.25 和 0.75 对应。如果数据以升序排列,则 25% 的值位于第一分位数之下,25% 的值位于第三分位数之上。第一和第三分位数是分位数的特殊情况。分位数的计算方式如下:
quantile = (i - 0.5) / N
其中 i 是第 i 个有序数值。
离散度的测量值
平均值周围点的离散度是所显示频率分布的另一特征。
数据的方差是所有值与平均值之间的平均平方差值。由于涉及到平方差,计算得到的方差通常