①回顾集中趋势描述统计的知识
②录入例4-1的身高变量120个样本,保存数据(纯手打数据)
绘制频数表、频数分布图、计算统计描述指标
选择【分析】-->【频率】,打开如下的弹窗:
这里需要人工调整的只是【统计】和【图表】两个按钮
注意:上框内都是计算百分位数,上面操作是不对的,这不是多选(选分割点就8要选百分位数)。不足的是:这里的操作不能进行分组。
进行数据频数表的分组的操作(2种方法):
①生成新变量:
【转换】-->【重新编码为不同的变量】打开如下的弹窗:
将原变量【height】输入到栏内(图框①),在图框②内定义新变量名【group_height】,点击图框③的【旧值和新值】,打卡如下的弹窗:
选择图框①的【范围】,设置每个组段的上限和下限(要都能取到)
在图框②内设置新值(框②内的值会赋给新变量,对应旧变量在框①范围内的值)
点击框③【添加】。这种分法很麻烦,需要手动输入一个个组段。最后点击【继续】回到原弹窗,点击确认,建立新变量。
②可视分箱
【转换】-->【可视分箱】,将操作的数据选择为原始数据,点击【继续】
点击下图框①,定义新变量名,点击【分割点】(图框②),对数据进行分割(切法式面包一样):
打开新弹窗如下:
框①中【第一个分隔点】想到切面包的第一刀,确定第一组的上限;【分割点数】确定挥刀数,12就是将数据分成13组。点击下【宽度】(会自动计算)最后点击【应用】(框②)
回到最先的【可视分箱】,点击【生成标签】查看各个样本值所属的分组,点击【确定】生成新变量height2(变量值是操作变量对应的组号)
在对应的【变量视图】可以看变量值对应的标签(因为操作时有选【生成标签】)
对于已经完成频数统计的数据怎么进行统计描述
例如,对于身高变量的数据,得到的不是一组原始值,而是一份频数表:
左边变量是频数表组段的中间值【midpoint】,右边是对应的频数【f】,也叫做权数。
选择【数据】-->【个案加权】,打开弹窗如下:
将频率变量丢进去,点击确定,查看下图的标志:
可以看到代码运行完毕(图框①)和主窗口右下角的【权重开启】标准(图框②)
点击【分析】-->【统计描述】-->【频率】就可以计算统计指标和绘制直方图。