数学建模——计算机工具的使用(1)——SPSS操作以及在统计分析中的应用

本文指南

  • 本文讲解SPSS操作以及基础数据分析概念。
  • 文章立志于打造字典级SPSS操作指南,因此建议读者根据目录适当食用。
  • 本应用将持续更新到2020年2月14日美赛,主要更新内容集中在分析(高级)内容,主要采取的形式是链接到我的其他博客中。
  • 文章所使用的资料来源集中于《数学建模》书籍,以确保内容的准确性,并采用图示操作形象化文字描述。当然本文内容还有大量的其他资料来源以及浅薄的个人经验整理。
  • 如果你在阅读时发现了错误,请在下方评论区进行评论,万分感谢。
  • 如果你觉得内容尚可,感谢点赞。
  • 最后,祝愿诸位与我共同进步,学有所成。

一、SPSS简介

  1. 在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法。
  2. SPSS 的基本功能包括数据管理统计分析图表分析输出管理等等。
    1. SPSS 统计分析过程包括描述性统计均值比较一般线性模型相关分析回归分析对数线性模型聚类分析数据简化生存分析时间序列分析多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析曲线估计Logistic 回归Probit 回归加权估计二阶段最小二乘法非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数
    2. SPSS 也有专门的绘图系统,可以根据数据绘制各种图形

二、SPSS操作

1. 基本步骤

以统计分析为引:

  1. 录入数据或者打开一个已经存在的数据文件,根据需要进行数据转换;
  2. 选择合适的统计分析过程,选择统计分析所采用的方法和参数;
  3. 分析SPSS 输出的结果,并保存结果。

2. 数据管理(Data Management)

1. 主界面

  1. 启动SPSS 后,出现的界面是数据编辑器窗口,它的底部有两个标签:Data View(数据视图)和Variable View(变量视图),它们提供了一种类似于电子表格的方法,用以产生和编辑SPSS 数据文件。
    1. Data View(数据视图)用于查看、录入和修改数据;
    2. Variable View(变量视图)定义和修改变量的定义。
      在这里插入图片描述
  2. 与Excel的一些区别
    1. 列是变量,即每一列代表一个变量(Variable)或一个被观测量的特征。
    2. 行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS 中称为事件(Case)。
    3. 单元包含值,即每个单元包括一个观测中的单个变量值。单元(Cell)是观测和变量的交叉。与电子表格不同,单元只包括数据值而不能含公式。
    4. 数据文件是一张长方形的二维表。数据文件的范围是由观测和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS 将数据长方形延长到包括那个单元和文件边界之间的任何行和列。
  3. 如果要分析的数据还没有录入,可用数据编辑器来键入数据并保存为一个SPSS数据文件(其默认扩展名为sav)。
    在这里插入图片描述

2. 变量视图

1. 定义变量
  1. 输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。
    在这里插入图片描述

  2. 操作步骤

    1. 单击数据编辑窗口中的Variable View标签或双击列的题头(Var),显示变量定义视图。
      在这里插入图片描述
    2. 在出现的变量视图中定义变量。
      在这里插入图片描述
  3. 变量定义信息的解释

    1. Name:定义变量名。变量名必须以字母或字符@开头,其它字符可以是任何字母、数字或_、@、#、$等符号。变量名总长度不能超过8 个字符(即4个汉字)。
    2. Type:定义变量类型。SPSS 的主要变量类型有:Numeric(标准数值型)、Comma(带逗号的数值型)、Dot(圆点作小数点的数值型)、Scientific Notation(科学记数法)、Date(日期型)、Dollar(带美元符号的数值型)、Custom Currency(自定义型)、String(字符型)。单击Type相应单元中的按钮,选择合适的变量类型并单击OK。
      在这里插入图片描述
      在这里插入图片描述
    3. Width:变量长度。设置数值变量的长度,当变量为日期型时无效。
    4. Decimal:变量小数点位数。设置数值变量的小数点位数,当变量为日期型时无效。
    5. Label:变量标签。变量标签是对变量名的进一步描述,变量只能由不超过8 个字符组成,8 个字符经常不足以表示变量的含义。而变量标签可长达120 个字符,变量标签对大小写敏感,显示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。
    6. Value:变量值标签。值标签是对变量的每一个可能取值的进一步描述。
    7. Missing:缺失值的定义方式
      SPSS 有两类缺失值:系统缺失值用户缺失值
      • 在数据长方形中任何空的数字单元都被认为系统缺失值,用点号( • )表示。
      • SPSS 可以指定那些由于特殊原因造成的信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测被特殊处理。默认值为None。
      • 单击Value 相应单元中的按钮,可改变缺失值定义方式。
        在这里插入图片描述
        在这里插入图片描述
    8. Column:变量的显示宽度。输入变量的显示宽度,默认为8。
    9. Align:变量显示的对齐方式。 选择变量值显示时的对齐方式:Left(左对齐)、Right(右对齐)、Center(居中对齐)。
    10. Scale:变量的测量尺度。根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、定距变量和定比变量。
      1. 定类变量。定类变量由称为名义(nominal)变量。这是一种测量精度最低、最粗略的基于“质”因素的变量,它的取值只代表观测对象的不同类别例如“性别”变量、“职业”变量等都是定类变量定类变量的取值称为定类数据或名义数据。定类数据的共同特点是用不多的名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的,即由计数一一而得。唯一适合于定类数据的数学关系是“等价关系”。因而,在定类数据中,同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等
        在这里插入图片描述
      2. 定序变量。定序变量由称为有序(ordinal)变量、顺序变量,它的取值大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如:“最高学历”变量的取值是:1-小学及以下、2-初中、3-高中、中专、技校、4-大学专科、5-大学本科、6-研究生以上。由小到大的取值能够代表学历由低到高。定序变量的取值称为定序数据或有序数据。适合于定序数据的数学关系是“大于(>)”和“小于(<)”关系。在定序数据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小于”的关系。而且进行保序变换(或称单调变换),不改变数据原有的基本信息即等级顺序。最适合用于综合定序数据取值的集中趋势的统计量是中位数
        在这里插入图片描述
      3. 定距变量。定距变量又称为间隔(interval)变量它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量,其取值60与20相比,表示60岁比20岁大,并且可以计算出大40 岁(60-20)。定距变量的取值称为定距数据或间隔数据。定距数据是一些真实的数值,具有公共的、不变的测定单位,可以进行加减乘除运算。定距数据的基本特点是两个相同间隔的数值的差异相等。对于定距数据,不仅可以规定“等价关系”以及“大于关系”和“小于关系”,而且也可以规定任意两个相同间隔的比值或差值。如果将每个数值分别乘以一个正的常数再加上一个常数,即进行正线性变换,并不影响定距数据原有的基本信息。因此,常用的统计量如均值、标准差、相关系数等都可直接用于定距数据
      4. 定比变量。定比变量又称为比率(ratio)变量它与定距变量意义相近,细微差别在于定距变量中的“0”值只表示某一取值,不表示“没有”。例如,人的身高就是一个定比变量,如果身高值为“0”米,则表示这个人不存在。定比变量的“0”值表示“没有”。而在测定温度的摄氏表中,0oC 并不表示没有温度,因为还有在零度以下的温度。定比变量的取值称为定比数据或比率数据。定比数据也同样可进行算术运算和线性变换等。通常对定距变量和定比变量不需要加以区别,两者统称为定距变量或间隔变量
      5. 一般地,定类变量(名义变量)和定序变量(有序标量)用于描述定性数据,属于定性变量;而定距变量和定比变量用于描述定量数据,属于定量变量。
2.数据的输入与编辑

health.xlsx

  1. 在数据视图中可进行正常的基本操作;
  2. 右键可多选;
  3. Ctrl + F 可进行关键字搜索;
  4. 查找特定观测(行);数据 ==》定义变量属性
    在这里插入图片描述
  • 17
    点赞
  • 102
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.Persimmon

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值