8、数据的拆分、筛选、加权与平均

本文详细介绍了如何使用SPSS进行数据拆分、筛选、加权和汇总操作。在数据拆分中,包括不拆分、按条件拆分等选项。筛选功能涉及多种选择条件,如所有个案、条件满足等。加权部分讲解了如何使用个案加权系数并对比加权前后的差异。最后,文章阐述了简单的数据汇总以及多重数据汇总的方法,包括不同汇总函数的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、拆分

二、筛选

三、加权

四、汇总

(一)简单数据汇总

(二)多重数据汇总


一、拆分

1.打开数据

2. 单击【数据】菜单,选择【拆分文件】菜单,弹出对话框,

2.1 选择第一个选项是分析所有个案,不创建组,这是系统默认的选项,结果是不进行拆分

运行结果:没变化

2.2. 选择第二个选项如

运行结果:

但这样不够直观,可以进一步进行【描述统计】与第三选项进行比较

2.3 选择第三个选项如

运行结果:

进一步进行【描述统计】得

二、筛选

1.打开数据

还用上面的数据如:

2. 打开【数据】——【选择个案

“选择个案”对话框右侧“选择”栏有5个选项:

  1. 【所有个案】——即未做筛选,选择所有个体;
  2. 【如果条件满足】——根据所需要筛选的条件选择相应条件限制;
  3. 【随机个案样本】——选择总体中大约百分之多少的个案,或者选择恰好多少个案数量;
  4. 【基于时间或个案范围】——自行设置从第几个个案到第几个个案;
  5. 【使用过滤变量】——筛选时,会将选中的变量为零的情况剔除。

下面“输出”栏根据具体情况可进行设置,一般保留默认设置

3. 在“选择”栏里选中第二项【如果条件满足】——【如果

在这里我们取5<销售量<10(可以设置单变量也可以设置多变量,用&字符连接即可)

4.输出结果

三、加权

1.打开数据

继续沿用前面数据,只是简单介绍一下操作

2.选择【数据】,单击【个案加权

3. 弹出个案加权窗口,勾选“个案加权系数”,将“城市水平”选入频率变量中,点击【确定】按钮

3.到此,加权进行完毕,需要通过交叉表比较加权前后的区别

3.1依次单击【分析】-【描述统计】-【交叉表

3.2弹出交叉表设置窗口,将“地区”选为行变量,“城市水平”选为列变量。点击【确定

3.3输出结果(左图为加权前,右图为加权后)

注意:在加权时,请注意:

1.“个案加权系数”应代表某观测量的计数信息。

2.“个案加权系数”可以为小数(在符合实际意义的情况下)。

3.“个案加权系数”为0、负数、缺失值时,会被自动剔除。

4.如果该分析不需要“个案加权”,请取消加权处理,即依次单击“数据-加权个案”后,勾选“不对个案加权”。

四、汇总

(一)简单数据汇总

1.打开数据

2.选择【数据】-【汇总

3. 在【分界变量】中选入地区,【变量摘要】中选入销售量

汇总数据中的其它选项

【个案数】指在结果中显示各分组的个案数,可以自己命名。

【保存】

  1. 将汇总变量添加到活动数据集,指将汇总变量添加到当前的数据集界面中。
  2. 创建只包含汇总变量的新数据集,指将汇总变量添加到新建的数据集界面中,可以自己命名数据集名称。
  3. 创建只包含汇总变量的新数据文件,指将汇总变量保存到一个新的SPSS文件中,可以自己选择保存路径。

【用于大型数据集的选项】

  1. 文件已按分界变量进行排序,若事前排序过则选择此项。
  2. 汇总前对文件进行排序,若选择此项则在数据视图中显示的为按分界变量进行排序后的结果

汇总数据框中的【函数】有:

在汇总函数界面中,汇总函数主要有6种

(1)摘要统计:主要为概括型的函数,包括平均值、中位数、总和、标准差。

(2)特定值:选择特定值函数,包括分组内的第一个数值、分组内的最后一个数值、分组内的最小值、分组内的最大值。

(3)个案数:汇总观测数量,包括加权的观测数量、加权的缺失值的数目、未加权的观测数量、未加权的缺失值的数目。

(4)百分比:以百分比的形式表示观测数目。

(5)分数:以分数的形式表示观测数目。

(6)计数:以数字的形式表示观测数目。

  • 上:大于指定值的观测数目占总观测数目的百分比。
  • 下:小于指定值的观测数目占总观侧数目的百分比。
  • 【值】中输入指定值。
  • 内部:在上限和下限这一区间内(包括上限和下限的值)的观测数目占总观测数目的百分比。
  • 外部:在上限和下限这一区间外(不包括上限和下限的值)的观测数目占总观测数目的百分比。
  • 【上限】和【下限】中输入选定的值。

4.输出结果

可以对结果按照销售量均值升序排序,结果如下:

(二)多重数据汇总

1.打开数据

数据不变~~~

2.【分界变量】选入城市水平、地区,选择【汇总前对文件进行排序】

Ps:分界变量中的前后次序决定了汇总的先后顺序。(此例中城市水平为主分界变量,地区为第二分界变量。)

3.输出结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值