今日课程内容
-
内容回顾
-
作业讲解
-
数据处理
删除重复值
处理异常值
数据的合并
数据的拆分
…
内容回顾
1.spss的介绍与安装
2.spss的基本使用
3.spss的结构
变量视图-》》类似于数据库的列名设计
数据视图-》》类似于表格
步骤:先设计数据的表名(变量),数据的操作
4.spss的专业术语
case
sample
value
...
5.调查问卷
调查问卷的设计原则
调查问卷的方式
6.调查问卷里面的单选、多选、变量
多选:
确定选择个数n:
分类法:将变量定义为n个,再通过标签进行选择
不确定选择个数:
二分法:将数据的选择,使用"是"或者"否"
Spss课程安排
1.spss的基本操作
2.spss-问卷调查
3.spss-数据处理
4.spss-描述分析
5.spss-推断统计
6.spss-线性回归
7.spss-逻辑回归
8.spss-时间序列
9.spss-RMF(用户行为分析)
作业
员工信息表数据录入
1.mysql
2.spss
数据处理
数据处理是数据分析的前提
包括:
数据选取
数据分组
数据排序
数据合并
数据转置
数据拆分
数据汇总
缺失值替换
数据计数
数据加权
计算新变量
数量、单价
金额
变量重新编码:分组、筛选...
重复数据查询
SPSS-导入数据
百分数:用于确定自动数据格式的值所占的百分比
95则代表以95%的数据定义数据格式
# 注意
日期—将日期导入为数字类型
数据选取
选择方案:
1、所有个案
2、如果条件满足:条件筛选
3、随机个案样本
4、基于时间或者个案范围
5、使用过滤变量
输出结果:
1.过滤
2.复制到新的数据集里面
3.删除未选定的个案
思考:不能作为变量选择,怎么解决:
# 选择个案的特点:必须是数据值
处理方案:重新对变量进行编码处理
1 北京
2 上海
3 深圳
# 重新编码
1、重新编码为不同变量
区域 - 我的区域
2、重新编码为相同变量
修改原变量
数据排序、重定向分组
排序:点击个案排序即可
案例:将数据进行分组
将价格2000元以下为1组
2001-5000 2组
5001-8000 3组
8001元以上 4组
步骤:对数据进行重新编码分组
数据合并追加
数据合并:
1.个案合并:
添加行数据
2.变量合并
添加列数据
# 注意:变量的选择,如果变量没有被选中,该变量会被删除
列的合并:必须有一个关键变量,该变量作为合并依据,并且在合并之前做相关排序操作
1 200
2 300
3 400
4 550
--------
3 200
1 10
4 20
2 50
--------
1 200 10
2 300 50
3 400 200
4 550 20
,如果变量没有被选中,该变量会被删除
列的合并:必须有一个关键变量,该变量作为合并依据,并且在合并之前做相关排序操作
1 200
2 300
3 400
4 550
3 200
1 10
4 20
2 50
1 200 10
2 300 50
3 400 200
4 550 20