8、数据的拆分、筛选、加权与平均

最新推荐文章于 2024-05-29 16:25:23 发布

洋洋菜鸟

最新推荐文章于 2024-05-29 16:25:23 发布

阅读量1.4k

点赞数

分类专栏： SPSS基础文章标签：开发语言 spss

本文链接：https://blog.csdn.net/qq_25990967/article/details/128795164

版权

SPSS基础专栏收录该内容

8 篇文章

订阅专栏

本文详细介绍了如何使用SPSS进行数据拆分、筛选、加权和汇总操作。在数据拆分中，包括不拆分、按条件拆分等选项。筛选功能涉及多种选择条件，如所有个案、条件满足等。加权部分讲解了如何使用个案加权系数并对比加权前后的差异。最后，文章阐述了简单的数据汇总以及多重数据汇总的方法，包括不同汇总函数的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、拆分

1.打开数据

2. 单击【数据】菜单，选择【拆分文件】菜单，弹出对话框，

2.1 选择第一个选项是分析所有个案，不创建组，这是系统默认的选项，结果是不进行拆分

运行结果：没变化

2.2. 选择第二个选项如

运行结果：

但这样不够直观，可以进一步进行【描述统计】与第三选项进行比较

2.3 选择第三个选项如

运行结果：

进一步进行【描述统计】得

二、筛选

1.打开数据

还用上面的数据如：

2. 打开【数据】——【选择个案】

“选择个案”对话框右侧“选择”栏有5个选项：

【所有个案】——即未做筛选，选择所有个体；
【如果条件满足】——根据所需要筛选的条件选择相应条件限制；
【随机个案样本】——选择总体中大约百分之多少的个案，或者选择恰好多少个案数量；
【基于时间或个案范围】——自行设置从第几个个案到第几个个案；
【使用过滤变量】——筛选时，会将选中的变量为零的情况剔除。

下面“输出”栏根据具体情况可进行设置，一般保留默认设置

3. 在“选择”栏里选中第二项【如果条件满足】——【如果】

在这里我们取5<销售量<10（可以设置单变量也可以设置多变量，用&字符连接即可）

4.输出结果

三、加权

1.打开数据

继续沿用前面数据，只是简单介绍一下操作

2.选择【数据】，单击【个案加权】

3. 弹出个案加权窗口，勾选“个案加权系数”，将“城市水平”选入频率变量中，点击【确定】按钮

3.到此，加权进行完毕，需要通过交叉表比较加权前后的区别

3.1依次单击【分析】-【描述统计】-【交叉表】

3.2弹出交叉表设置窗口，将“地区”选为行变量，“城市水平”选为列变量。点击【确定】

3.3输出结果（左图为加权前，右图为加权后）

注意：在加权时，请注意：

1.“个案加权系数”应代表某观测量的计数信息。

2.“个案加权系数”可以为小数（在符合实际意义的情况下）。

3.“个案加权系数”为0、负数、缺失值时，会被自动剔除。

4.如果该分析不需要“个案加权”，请取消加权处理，即依次单击“数据-加权个案”后，勾选“不对个案加权”。

四、汇总

（一）简单数据汇总

1.打开数据

2.选择【数据】-【汇总】

3. 在【分界变量】中选入地区，【变量摘要】中选入销售量

汇总数据中的其它选项：

【个案数】指在结果中显示各分组的个案数，可以自己命名。

【保存】：

将汇总变量添加到活动数据集，指将汇总变量添加到当前的数据集界面中。
创建只包含汇总变量的新数据集，指将汇总变量添加到新建的数据集界面中，可以自己命名数据集名称。
创建只包含汇总变量的新数据文件，指将汇总变量保存到一个新的SPSS文件中，可以自己选择保存路径。

【用于大型数据集的选项】：

文件已按分界变量进行排序，若事前排序过则选择此项。
汇总前对文件进行排序，若选择此项则在数据视图中显示的为按分界变量进行排序后的结果

汇总数据框中的【函数】有：

在汇总函数界面中，汇总函数主要有6种：

（1）摘要统计：主要为概括型的函数，包括平均值、中位数、总和、标准差。

（2）特定值：选择特定值函数，包括分组内的第一个数值、分组内的最后一个数值、分组内的最小值、分组内的最大值。

（3）个案数：汇总观测数量，包括加权的观测数量、加权的缺失值的数目、未加权的观测数量、未加权的缺失值的数目。

（4）百分比：以百分比的形式表示观测数目。

（5）分数：以分数的形式表示观测数目。

（6）计数：以数字的形式表示观测数目。

上：大于指定值的观测数目占总观测数目的百分比。
下：小于指定值的观测数目占总观侧数目的百分比。
【值】中输入指定值。
内部：在上限和下限这一区间内（包括上限和下限的值）的观测数目占总观测数目的百分比。
外部：在上限和下限这一区间外（不包括上限和下限的值）的观测数目占总观测数目的百分比。
【上限】和【下限】中输入选定的值。

4.输出结果

可以对结果按照销售量均值升序排序，结果如下：