3.SPSS


对于统计学中的数学公式不做推导以及计算,直接使用spss计算的p值

一.基本概念

1.总体:所有集合;样本:随机抽取的个体集群

总体一般不能直接验证,这时候就需要使用随机抽样得到的样本来推断总体
	在有偏估计中,样本标准方差S=总体标准差σ;
	在无偏估计中,样本标准差S方=总体标准差σ/根号n

2.中心极限定理

总体为X-N(μ,σ方)的正态分布,其随机抽取的大样本(>30)遵从X-N(μ,σ方/n)的正态分布

二.正态分布

其分布图形为“钟”形,面积表示命中概率
一般将其他正态分布(μ,σ方)转化为标准正态分布N(0,1)
举个例子
现有数据符合正态分布X~N(10,0.2),问随机抽取一个长度不到9.4的概率:
p(X<9.4)=Φ((9.4-10)/0.2)=Φ(-3)=1-Φ(3)=1-0.9987(查表得到)=0.0013
笔者对于其他分布一知半解,这里只解释一下基本含义
	卡方分布:多个正态分布的平方和(当取n个样本时,自由度为n-1)
	T分布:标准正态分布除以均方(平方和的均值)的根
	F分布:两个卡方分布相除(F(m,n):(y/m)/(x/n),m为x的自由度,n为y的自由度)

三.统计推论

1.构建原假设H0

设立原假设H0【能够推翻证明实验有意义】,确定置信度水平α,一般为0.05
再举个例子
为了确立某厂家的薯片均值是否为60g:进行以下步骤
	H0:薯片均值为60g,与总体相同 [H0一般为确定的结果,推翻时更有研究意义]
	查找资料查到标准差为3g;得到的样本量为50袋,样本均值为58g
	推估总体均值,大样本:构建总体统计量Z(标准正态)
		Z =58-60/3*根号50=-4.717
	查询表格,得到结果 p=1-0.9999=0.00001
小于0.05,此次事件为小概率事件,拒绝H0,不能确定质量为60g

2.统计量的构建

除了上述对均值判断构建出的Z统计量外,还有其他统计量

  • 均值
    • 大样本:Z分布
    • 小样本
      • 已知总体标准差:Z分布
      • 未知总体标准差:T分布
  • 比例:Z分布
  • 方差:卡方分布
  • 方差比:F分布

3.P值(显著性)判断

根据构建出的统计量,得到p值进行比较,从而判断是否应该拒绝假设

当得到p值小于给定范围时,判断为小概率事件H0,拒绝原假设
	
对于给定的范围α,需要根据题目要求判断单尾还是双尾。
如H0的假设有方向指向,应当采取单尾检验
	H0:μ≥1000,样本量为100,样本均值为960;给定α为0.05
	Z=960-1000/200/根号100=-2(查表,p值为0.9772)
	p=1-0.9772=0.0228<0.025

四.SPSS

1.数据的属性

名义:无法用于计算的字段。比如性别,班级,字符串类型均为名义
有序:可以进行排序,但是加减没有意义。比如喜爱程度,参与度
	【转化为度量:1,2,3来表示程度】
标量(定量):具体数值型,可排序可加减

2.参数检验

只有标量数据参与

2.1 两个样本之间

2.1.1单样本t检验

一个班级中平均分和60分的差异

将待检验样本与特定值进行比较
步骤:分析-比较均值-单样本t检验
看显著性,原假设为两者相等
2.1.2两独立样本t检验

两个班级测验的总分数差异

在一次测验中按照类属性分组为两个样本,进行均值比较
步骤:分析-比较均值-独立样本t检验
返回结果中存在两行的显著性,观测莱文方差的显著性:
	若大于0.05,接受第一行的数据
	若小于0.05,拒绝第一行的数据,即选第二个
原假设为类属性不影响两个样本的差异
2.1.3配对样本t检验

一个班级中某变化条件后的两次成绩对比变化

同一个样本的分别两次实验的差异性(比较前后变化)
步骤:分析-比较均值-独立样本t检验
看显著性,原假设为两次前后没有显著性差异

2.2 三个及以上样本

2.2.1简单方差分析

成绩在不同班级之间的差异性【是否不同】

有一个变量(成绩),一个班级因子(班级放到因子中)
步骤:分析-比较均值-单因素ANOVA
看显著性,原假设该因子对班级没有显著性差异
2.2.2多因素方差分析

成绩在班级和性别之间的差异性【是否不同】

有一个变量(成绩),多个因子(班级和性别)
步骤:分析-一般线性模型-单变量
看因子单独与结合因素对变量的显著性,原假设为无显著性
2.2.3相关性检验

成绩与某能力之间的关系

步骤:分析-相关-双变量
皮尔逊相关双尾,看相关性:0.4~1(中等,强,非常强相关)

3.非参数检验

定序与名义参与检验

3.1两独立样本差异性

某能力(定序)在不同班级(名义)间是否不同

步骤:分析-非参数检验-旧对话框-两个独立样本
看显著性,原假设为两者无差异(能力在班级之间相同)

3.2两关联样本差异性

确定能力1与能力2之间有关联,看两者是否具有显著性

步骤:分析-非参数检验-旧对话框-两个相关样本
看显著性,原假设为两者无明显差异

3.3不能确定两者是否有关

3.3.1 卡方列联表【一非参+一参】

检验能力(非参数)和成绩(参数)之间的关系

步骤:分析-描述统计-交叉表
能力非参数(放在行),成绩参数(放在列),点统计勾选卡方
看卡方的显著性,原假设为无显著性差异

3.1.2卡方列联表【两个非参】

检验能力(非参数)和某活动的参与度(非参数)之间的关系

步骤:分析-描述统计-交叉表
行列任意,点统计勾选卡方,勾选列联系数
看对称测量的显著性,原假设为无关
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值