直方图
除了上面各种描述数据整体状态的数值类指标,另外一种更形象的描述方法就是画图。最容易想到的就是以数据组的各个数值为横轴,各个数值在组中出现的次数为纵轴作条形图,即所谓的直方图。
对stroke_clean.sav中的age做直方图,连同数值类指标,如图3所示。
图3:数据组age的直方图
很简单的一张图,却可以反映出很多信息:
• 横轴上以中值(62.00)为点做一垂直于横轴的竖线,则竖线两边的直方图面积相等。
• 最长的条形对应的横轴的值就是众数(如果每个条形对应数据组的每个值,而不是一个区间)。
• 数据组的均值越大,直方图就越往横轴增大的方向移动。
• 数据组的标准差越小,直方图就越往图形的中间缩(峰顶变高,峰侧变窄),表明数据组的变异性越小。
除了上述已经介绍过的指标,若将图3的直方图中所有条形的定点连接起来(假设无限逼近最小组距),可以得到一根曲线,这根曲线就是所谓的分布曲线。对于不同分布曲线,将会在后面进行详细的介绍。这儿先来看看从分布曲线上看出