SPSS分析数据学习笔记

数据处理

  • 名称:
    可以在变量视图->标签中加上备注。
  • 值:
    变量视图->值标签中加上备注。
  • 若变量中对缺失值赋值了,那么可以在变量视图->缺失中标注。缺失值默认小于所有变量。
  • 对变量排序:
    数据->个案排序排序依据中优先级自上而下。
  • 将一部分变量过滤在外不参与计算:
    数据->选择个案->如果条件满足。被过滤掉的个案前面会有被划掉的标志。
  • 汇总数据:
    要计算某一个群体的数据指标。在数据->汇总中访问。
    分界变量放置用于分组的变量。
    汇总变量是要计算的量或者函数。
  • 转换变量:
    转换->计算变量转换->编码为不同变量
  • 选择性保存某几个变量:
    保存中勾选变量可以进行选择。
  • 计算变量的平均值,标准差以及Z标准化值:
    分析->描述统计->描述勾选将标准化值另存为变量
  • 对变量分析百分位数、频次、作图:
    分析->描述统计->频率
  • 计算排名:
    转换->个案排秩
    依据是以其他变量作为参照的,比如通过语文成绩来排序外语成绩。
    如果只是单纯计算排名只需要填入变量项。
  • 对变量设置权值:
    数据->个案加权

相关系数

两个变量之间是线性关系,那么皮尔逊相关系数绝对值大就是相关性强。
如果不知道是什么关系的情况下,即使算出相关系数,也不能说明他们相关,一定要画出散点图来看(图形->散点图)。

  • pearson(积差):两个连续变量间呈线性相关正态分布
  • spearman:利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,比皮尔逊适用范围更广。当不符合皮尔逊条件时一般使用斯皮尔曼相关。
  • kendall:等级相关系数,适用于两个变量均为有序分类的情况。

分类变量可以理解成有类别的变量,可以分为:
无序的。比如性别(男、女)、血型(A、B、O、AB)。
有序的。比如肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)。
通常需要求相关性系数的都是有序分类变量。

注:
肯德尔等级相关适用于k个评价者(或1个评价者先后k次)对n件事物进行等级评定的顺序数据,用于量化k个评价者(或1个评价者先后k次评价)之间的一致性;斯皮尔曼相关适用于计算两列等级数据或者不符合积差相关计算条件的两列连续数据之间的相关。

皮尔逊/斯皮尔曼

分析->相关->双变量

肯德尔

分析->非参数检验->旧对话框->k个相关样本勾选肯德尔。
结果:
在这里插入图片描述
肯德尔和谐系数教程

Pearson相关系数大小评判标准: ∣ r ∣ ≥ 0.8 |r|\geq0.8 r0.8为高度相关, 0.5 ≤ ∣ r ∣ < 0.8 0.5\leq|r|<0.8 0.5r<0.8为中度相关, 0.3 ≤ ∣ r ∣ < 0.5 0.3\le|r|<0.5 0.3r<0.5为低度相关, ∣ r ∣ < 0.3 |r|<0.3 r<0.3为弱相关。
肯德尔和谐系数:当评分者完全无序、不一致时,W=0。当评分者完全一致,W=1。W越接近1,评分者之间一致性越高。

相关性检验

T检验

进入:分析->比较平均值

  • 单样本T
    判断单个样本数据与某个值。
    在这里插入图片描述
  • 独立样本T
    自定义分组。
    莱文方差显著性<0.05,看不等方差。反之看等方差。
    在这里插入图片描述
  • 成对样本T
    两组,且两组人数相同(数据组数相同)。
    若数据组数不同考虑独立样本T检验引入分组变量。
    在这里插入图片描述
    结论:两组的差异极其显著。 t 9 = 4.28 , p = 0.002 t_9=4.28,p=0.002 t9=4.28,p=0.002

F检验(方差分析)

在这里插入图片描述

  • 单因子方差分析
    分析->比较平均值->单因素ANOVA。选项中选择方差齐性检验。选择事后检验LDS/Turkey。
    事后检验:方差齐的时候进一步检验。检验组内水平之间的差异。
    因子:分类的标准。
    因变量:需要检测的变量。
    结果:
    在这里插入图片描述
    *的:差异显著。
    在这里插入图片描述
    在同一列的:差异显著,反之不显著。
    在这里插入图片描述

报告结果:三种职业工资有显著差异。F(2,471)=431.481,p<0.001.
事后检验结果表明:Manager和Custodial、Clerical有显著差距。Clearical和Custodial没有显著差距。

  • 多因子方差分析

多因子分析用来研究两个或两个以上因素能否对指标产生显著影响(多个因子对结果的影响),进而找到利于指标的最优组合。在多因子方差分析中,以双因子的方差分析最常用。例如:研究不同种类、不同量的化肥对农作物的影响;分析不同品牌和不同地区对一种商品销售量是否影响等。
多因子方差分析可分为无交互作用和有交互作用两种:
一个因子水平下的指标好坏及程度不受另一个因子不同水平的影响,则称两因子之间无交互作用,要分别判断每个因子对指标的影响。
一个因子水平下的指标好坏及程度与另一个因子取什么水平有关,则称两因子之间有交互作用,记作A×B。此时除了要分别考虑每个因子对指标的影响外,还要考虑两个因子的搭配对指标产生新的效应。

因变量:一个。
因子:一个或多个。
固定因子:若目前该因子已经包含了所有想研究的范围。
随机因子:想进一步推广。

无交互作用:
分析->一般线性模型->单变量进入模型,选择“定制”,选入因子。
有交互作用:
分析->一般线性模型->单变量进入模型,选择全因子。
注:截距项可不算。

选项中勾选方差齐性检验、E、B。

结果报告:(以minority和jobcat对salary的影响为例)
主体间效应检验:看显著性
在这里插入图片描述
在这里插入图片描述

T检验和方差分析

  • T检验只能分析两个类别的数据,而方差分析可分析三组及三组以上的数据。
  • 方差分析和T检验都要求各组样本均数服从正态分布,各样本方差齐。

卡方检验

卡方检验是非参数检验的一种。

参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

进入:分析->非参数检验->旧对话框->卡方

  • 交叉表卡方检验
    分析->描述统计->交叉表统计勾选卡方。
    在这里插入图片描述
    结果描述:
    卡 方 2 = 79.277 p < 0.05 卡方_2=79.277\\ p<0.05 2=79.277p<0.05
    存在显著差异。
  • 2
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值