数值型数据的整理与展示
数据分组
1. 组距分组 (要点)
- 将变量值的一个区间作为一组
- 适合于连续变量
- 适合于变量值较多的情况
- 需要遵循“不重不漏”的原则
- 可采用等距分组,也可采用不等距分组
2. 组距分组 (步骤)
- (1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K 15
- (2)确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数
- (3)统计出各组的频数并整理成频数分布表
3. 组距分组 (几个概念)
- 下限(lower limit) :一个组的最小值
- 上限(upper limit) :一个组的最大值
- 组距(class width) :上限与下限之差
- 组中值(class midpoint) :下限与上限之间的中点值
数值型数据的图示
分组数据——直方图和折线图
1. 分组数据—直方图 (histogram)
- 用于展示分组数据分布的一种图形
- 用矩形的宽度和高度来表示频数分布
- 本质上是用矩形的面积来表示频数分布
- 在直角坐标中,用横轴表