spss三次指数平滑_17 统计学:SPSS基础

2a47f56b860f1138282a06f11a409a5b.png

内容目录

  • 为什么要学习SPSS
  • spss发展史
  • spss操作界面
  • spss基本使用方式
  • SPSS的常用操作
  • 数据管理
  • spss制作图表
  • 使用spss进行描述统计分析

1.为什么要学习SPSS

统计分析软件是数据分析的主要工具

统计设计完成后,完整的分析过程包括

  • 数据的搜集
  • 数据的整理
  • 数据的分析
  • 结果的报告

统计学为数据分析提供一套完整的科学的方法论,统计软件为数据分析提供了实现手段。

spss的基本特点

1.1优势

  • 功能强大
  • 兼容性好
  • 易用性强,是应用统计人员的首选
  • 扩展性高(以一种不同的方式)

1.2劣势

  • 计算速度相对较慢
  • 在统计模型的纳入上速度较慢

2.简单说一下spss的发展历史

SPSS名称

最开始:名称 Statistical Product and Service Solutions

现在:IBM SPSS Statistics

2.1 发展历程

世界上最早的统计分析软件

60年代:美国斯坦福三位研究生研发

70年代:1975年成立法人组织、在芝加哥组建了SPSS总部,退出SPSS中小型机版-SPSSX

80年代:微机版(V1~4)SPSS/PC+

90年代:Windows版(V6~10)

本世纪:11~25,中文版,2010年被IBM收购

现在最新版本是25,中间可能会有一些bug,但基本问题不大,可以正常使用

2.2 SPSS与其他分析软件对比

spss是最早的统计分析软件,发展到现在,已经比较成熟,同类的分析软件有SAS和R

SAS:统计分析软件,有一定难度,难上手,收费的,市场研究用的比较多

R:是一个编程语言,会python就没必要学它了,开源的,也是有各种包

SPSS相对简单,易上手,功能也不差,而且现在被IBM收购之后,与office无缝衔接,很好用,SPSS可以跟python R等连接使用,很方便。

3.spss操作界面

3.1工作名称与存储名称

coffee.sav 为文件存储名称

[数据集5]为文件工作名称

详细说明:

若你是从硬盘上打开的文件,会自动读取文件存储名称,另外spss会按照编号编制一个数据集X的名称,以便区分,不同盘的文件名相同的情况。

d541c9b1200eb4b3dcd6be64274403bc.png

若是新建文件,则文件尚未保存到硬盘上,命名为:按照编号无标题X,等你保存的时候可以修改

d149b364e3e0ca1ad9a3472becb1cf36.png

d857dbd7c049575826662b929f3556f6.png

3.2四大窗口

  • 数据编辑窗口

f3711cd00d536601cb7b347999143966.png

跟Excel真的很像,就是一个电子表格

数据视图:主操作界面

93c09fd892d8135feb9fa442d656a0db.png

变量视图:定义变量

这个跟Excel稍有不同

  • 结果浏览窗口

2d1102a7c5759ab53f8e21f4907a8a0e.png

我们选择相应的统计分析之后,分析结果都会在单独的窗口呈现

统计软件里最美观的结果输出

提供类似资源管理器的界面和操作方式

  • 语法窗口

如何打开语法窗口

打开一个新的语法窗口

【文件】--【新建/打开】--【语法】

33e171128899764a180e58af4f34e5fc.png

执行语法,可以看到结果

spss的执行原理

1.选择操作按钮

2.转义成可执行的spss语言代码

3.生成分析结果

  • 脚本窗口

打开方式

python脚本

92df3e37ac16bd4f47b2f6e792a931a5.png

35cb325f93b00cb102978cb837020812.png

Basic脚本

【文件】--【新建/打开】 -- 【脚本】

9a0d0a31e09b7ebab4715d9c1f201f47.png

用于二次开发,用的不多,了解就可以了

4.spss基本使用方式

4.1菜单式对话框介绍

采用菜单方式和对话框方式,操作简单,易于上手,功能也不差

80c3fbcafb21f5b8d966faf8c31c2a63.png

候选变量列表框

测量尺度+标签+变量名方式

五个标准按钮

  • 确定、取消
  • 粘贴:用于自动生成SPSS程序
  • 重置:恢复对话框为初始状态
  • 帮助:方法,用法介绍

其他按钮

  • 多数情况下回弹出二级对话框
  • 灰色表示不可用

b277df2ea5fe2c4dbdaca965d573d5f7.png

二级对话框

d210dd5e1c5602ce87f487c38afb27ae.png

单选框(组)

  • 一般均成组出现,多选一

复选框(组)

  • 可成组,也可单独出现,多选多

文本框

下拉框

4.2变量存储类型

a9eff3c4c1df65eacfb9c1b155e716fc.png
  • 数值型:应用最为广泛
  • 字符型:由于分析、整理都较困难,建议少量使用,改为编码录入
  • 日期型:实际是特殊的数值型变量,尽量少用

注:大部分情况下,使用数值就可以了

其他附加属性

变量名与变量值标签

可用于对变量及变量值含义进行说明,使结果更易于阅读

daa1bb7549fbf82d83296745ec2c80a4.png

缺失值

除非问卷中有特殊编码,否则按默认情况处理

4.3 spss如何导入外部数据

4.3.1.如何读取Excel文件

我们在工作中,经常用到导入Excel文件,其实这个操作也很简单

4606652f7e65017fe6dc4d141d809cba.png

c832737b0a79e0bc6aacb4fc7b02eea7.png

d7256a1decf648754b3becc1de9567e1.png

4.3.2.如何导入数据库文件

通过ODBC资源管理器实现

这里以mysql数据库为例,如果没有ODBC驱动的话,需要安装,这里提供mysql的ODBC驱动网盘链接

链接: https://pan.baidu.com/s/1C-Gky6o0aql0qXO54NZ6qw 提取码: 36ya

安装好驱动以后,需要做以下步骤

step1:【文件】--【导入数据】--【数据库】--【新建查询】

0c36d35201a74317ec7052ae4abacf93.png

step2:【添加ODBC数据源】--【用户DNS】--【添加】--【mysql的相关驱动】

05f680b9e9bd8fa3e493b0703b3938b8.png

step3:按照图片提示填入相关信息

211304b02e2de950e38abd861cfdc661.png

2a3735b0184374a01aaa34e3ea343118.png

fb2e1279150dff391096d2802ab88bef.png

step4:选择你库中要导入的表,可以选择整张表,也可选择一张表的某些字段,确定即可

7a1492b8e91ea654d16ee418b0b3366a.png

4.3.3.如何导入文本文件

step1:【导入数据】-- 【文本数据】

3eee13f4727246b12a5fbb557121dbaf.png

step2:选择文件位置--选中文件--打开

8a46a5dc6cd9e14452c461ec876c08bb.png

点击下一步

5635fb8fa50944f160a1dcd705c180ca.png

step2:根据实际情况选择

bdac6549973faf4c0b51229aee6f4531.png

step3:按照实际情况选择,基本默认就能满足

e13416292914ec575a1f7f5064680fb6.png

step4:

d1cc0328a5dcb81a41b7665cdbda90f3.png

​ step5

bcc9bff137c6b26defbb0e4ea597ee0f.png

step6

3aca51337d9df091206dbe34f6600e8c.png

step7

4dd4018d8728e7dbfd873da844d3e983.png

数据已成功

ea239f76c5ca8ad67594389fc52ab7da.png

好的,以上就是我们经常遇到的导入外部文件的问题

4.4 保存与导出

4.4.1源数据文件的保存

1.打开已有文件:ctrl+S保存即可

2.新建的文件:另存为指定的格式

fc1d7c8e7a6a7728d58de51ab6fa59fc.png

3.保存部分变量

spss的灵活之处

fb77c8bfdfc3b0a16895ce2b02ed0eb5.png

保存为Excel格式

2357f14597d866ca09d8503d17da555b.png

好处:

​ 1.可以保存名称,也可保存标签

​ 2.可追加保存到同一个Excel文件的不同sheet

​ 3.还可以直接保存值标签(例如:性别一列,0代表男,1代表女,保存值标签直接保存的是男或者女,更直观)

注:保存为其他格式时,spss尽量做到兼容,但难免会出现问题,这个是无法避免的

4.4.2结果窗口的保存与导出

保存

f53338f1ffd7d55b1b1e77bbc0107437.png

导出

常用的是导出Excel

96b626bdb5c729d9bef1d764b24dbfcf.png

结果输出

a634eee774128f4c137015606e6f92dc.png

当然除了保存和导出,我们还可以对某个图或某个表进行复制粘贴操作,这个在Excel中和Word中都有很好的兼容

5.SPSS的常用操作

5.1数据录入

统计分析大部分都是针对二维表来实现的,我们都见过哪些二维表呢?

Excel中:行:数字组成 列:字母组成

1bc2c130572df3ca7c9db8ea5b126281.png

SPSS中:行:数字编号组成 列:变量名称

e67106fe98a440ea0df02eb8fe2c14bb.png

关系型数据库:mysql SQLserver

936c1556215ee66bc80492bd2ee04266.png

所以,基于二维表的操作,想必大家都不陌生了吧

那下面,我就说一说SPSS不同于其他软件的操作方式

SPSS中的数据由两部分组成,数据视图和变量视图,数据视图用来存储数据,类似于数据库中的表,变量视图用来定义变量的一些属性,类似于数据库中的表字段的设置

892af374b5dcb538b030b737ebf42163.png

SPSS作为一个专业的统计分析软件,在处理调查数据的结果处理上是非常友好的

8fa264f2a809d3cf49dc4c56ee7ad7bd.png

标签:用来解释这个变量存储的主要内容,类似于数据库中的注释

值:我们在进行数据处理的过程中,往往比较喜欢用数字,那对于文本型的内容,可用数字进行替换,值就是数字与文本的对应设置,例如:性别一列,0代表男,1代表女,那存储的时候就只存储0或1,而实际的值则是男或女,一般是针对分类标签而言。

01d19fe49afe67ba9b9675179a24f68c.png

如何录入

测量

讲到测量就不得不说一下,统计学上对于变量的测量尺度的分类了

测量尺度:指用怎样的精确程度来测量所感兴趣的指标

名义尺度:无序多分类,无大小,顺序之分,例如:性别,种族等

顺序尺度:有序分类,无大小,但有序,例如满意度,成绩等级,衣服的尺码等。

标度尺度:有大小,有顺序

​ 定距变量:0是由意义的,温度

​ 定比变量:0是无意义的,身高

1c39462a46a439573fdd4fbe180374d6.png

我们可以进行从高级别到低级别的类型转换,但是不建议从低到高

例如:可以把成绩0-100按照优良中差进行转化,但是要把优良中差强行按照某种规则转换成数字则存在很不准确的情况。

接下来看看在SPSS中的测量操作

名义:无序分类变量

有序:有序分类变量

标度:是连续型变量

测量 这个设置对分析起着非常大的作用,系统会根据你定义的类型不同,来默认显示不同的分维度

3bb1f4015196d4d3d7f2e62b52f15af1.png

5.2查找与替换

跟Excel一样,Ctrl+ F查找,Ctrl+H 替换

ed7dbf9fdda1ab92f6dd839f11a21208.png

5.3 计算字段

可以实现基于之前的变量,经过计算,得出一个新的变量,也可以替换原有变量

fe2907b89031414438ec74ef8530c655.png

1e907563a17ffb46b25b9b53d481a492.png

5.4 排序

单个变量排序

cb92729f54c83faa3ed8824c8a711ed9.png

多个变量的排序

cea98ca2012e24f99a019c8ce7d6c499.png

0331a5f4e627c2efa8c48314502280a7.png

5.5 数据拆分

同一张表,有城市北京 上海 广州,则需要对每个城市做分析

edc672166bf5df4dbc8b926a19c6efcc.png

6e6c3a35f188f2e5349cf3fb07156b57.png

对年龄进行描述统计发现,按照分好的组进行分析的

b3c4ee504310c7a8df4e4c9cb953148f.png

使用完之后,如果不想对源数据进行修改,我们要重新进入,修改为原来状态

e842ae02b5676b04021e0762d9183800.png

5.6 筛选

c32675c25945fcf174a73aaf8fa04ed7.png

a050bf76c21256720cb9baad2a2cf03e.png

此时,我们看筛选结果

2209cc67037364cf3aaedbeb2d849fe0.png

接下来做一个简单的分析

筛选后分析

0fa9ffd3fd4de735ae58e3936c5abe79.png

筛选前分析

60fcc18457a464083671cca41f2f9aea.png

数据已经是根据筛选后做的了,因此,如果这时候保存,那原始数据就受到影响了,最好用完之后恢复到原来设置

94d5a47f4c204efa72021652300b56d8.png

6.数据管理

需求:求每个月每个城市的指数均值

6.1数据汇总

7ebe3910d57f99fe3a5e85b680254b9c.png

44aed472f061b2c63adf875ba157e114.png

结果

5111ae449b1f89f31fd8fd91d0d655e2.png

6.2 数据重组

我们标准的数据存储格式,应该是同一类型的数据放在同一列,但有时候并不是这样

例如:

744b475f77a798985fdeb76df32690c9.png

标准的格式

ed5ee4d2271846268d6c4a2936baa2dc.png

面对这种情况,我们该怎么办,难道要一个一个复制粘贴吗?

其实不用,SPSS有专门的功能来处理这种情况,而且可以相互转换

713ed1cdbd125edc21c6a9170ab7ca76.png

三种情况,一目了然

第一种情况:我们暂且叫宽型转长型

第二种情况:长型转款型

第三种情况:转置,行变列,列变行,这个就比较常见了

那拿第一种情况举例

80e7322c696bdb584af5d1719aca9c5e.png

df6b57b52d2c1ddbd0a67d337ae263ea.png

76e5949c78b660f230e61e21b00657bf.png

1b6b568df0ab50d8db5e50ab5d6e3445.png

b1d36be6c5a4496a174ca6f2fe469c55.png

后面一步,默认即可

最终就可以实现了

237ace15068132c423c8cc3ea5e3c68c.png

长型转宽型

需要个别注意的是这一步

b4dfbb839378e4486d3d9645fb4b2938.png

6bc21e6f62cbc503287b8bfc6b9bfe0a.png

其他的按照默认的就可以了

结果展示

d4f4708b8fe6e455855fe3b46f6504ad.png

主要用于重复数据的记录

6.3 多个数据文件的合并

纵向合并

从外部文件中增加记录到当前文件中

将a.sav与b.sav合并

a.sav表

78e2c36bdec6d72809e68f9f469459b2.png

b.sav表

296d07a81321ac278a0677394dd59798.png

纵向合并,是把列相同的直接放在下面,列不同的需要手动设置

dbe83071afbad21194325b4ac3f2b328.png

dd54d7814fd75235772b8159c16dc269.png

baf09bcf3202c4d2a0333fee3a78430f.png

8debadbceb9e646b16c11eca83b02348.png

918021b3fcef80ab3fb6f9590acace5b.png

c5dac674a3ba023b4b863b1c56bac7fd.png

合并成功

1d176b147ea9dd9f3d546afdce327c25.png

横向合并(连表操作,根据指定列进行合并)

baa459923e0000c8c319a1df3dfc959e.png

94dc60bc23358bdda1484efe40c1ee2a.png

6a3d4fa8dde791c31cbd1b59f656e861.png

可以尝试一下,几种不同的合并方法,类似于sql中左连表,右连表

4e753ed581a2624f7ebd373fa41f1e51.png

db5e1d4f16e9a0c7228bc3f320e3a0eb.png

6.4 标识重复个案

b0ca54dd652c530553f77d5bcfb58c43.png

5c5fee4848792b73af6d4a7e4c069672.png

结果显示

7831540fc49587233e424932fb884c94.png

202be87188d66624c31cb37828ddbb56.png

7.SPSS制作图表

最大优势:基于数据分析的需求来展开,灵活进行调整

图形的创建

  • 可视化的图表构建器:主要操作方式

9a3d69e62d2c9550a841957da6aa2514.png

d1e190c0569da5a6de83d10554ee8a2b.png

结果呈现

954e427a1ca1184fb9fd39d45c4a2a3a.png
  • 继承自老版本的传统对话框
  • 方便老用户使用
  • 注意有些特殊图形只能用该界面生成

a31aa7da1dc3913f6ad9ee5d961fb670.png

详细介绍绘图对话框

巴拉巴拉巴拉

图形的编辑

选中控制框,可改变大小和位置

d8001897f21cb0812b00d1a9860128f1.png

6b5ef47588e1188b68939df557634bb8.png

标准操作:

​ 单击图形元素,选中所有同类元素

​ 二次单击,则选中同组元素

​ 三次单击,则只选中该图形元素

a9e46b790443b6bab29f288280c0032c.png

快捷方式

​ 有图例时,单击图例则选中所有相应的图形元素

​ 使用套索方式,一次选中多个对象

4153489cd74c184992ce9986b10cb2ca.png

8.描述统计

对于描述统计,我们主要讲常用的四种操作

48da1370495335a32ef9d7cf2be59638.png

8.1频率

有比较全面的统计描述的内容,可根据频数进行相关的分析

d8be55092d49c04e93875b2694c90d1c.png

8.2描述

用于正态分布的连续型变量

b764dac995e35c77cd722a445f4413c7.png

8.3探索

可对变量进行更为深入详尽的描述性分析,也是比较常用的

156417837c8640720b8bece685e67254.png

8.4交叉表

73ede792d0f45c3b960f8c44cb8239df.png

内容推荐

ailsa:干货奉上:业务数据分析学习目录​zhuanlan.zhihu.com
9602e08f6317ced97dd90ee8744e07ef.png
ailsa:20 Tableau-数据可视化专业软件​zhuanlan.zhihu.com
a80359fbbee0fe0301e0234289850f26.png
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值