基于spss的多元统计分析 之 单/双因素方差分析 多元回归分析(1/8)

实验目的:

1.掌握单样本t检验、两样本t检验、配对样本t检验、单因素方差分析、多元回归分析的基本原理;

2.熟悉掌握SPSS软件或者R软件关于单因素、多因素方差分析、多元回归分析的基本操作;

3.利用实验指导的实例数据,上机熟悉以上3种方法(t检验、方差分析、多元回归分析)。

实验内容:

1. 实验数据为专业学生核心课程成绩及实验指导中的数据;

2. 利用SPSS或者R软件上机实践单样本t检验、两样本t检验、配对样本t检验、单因素方差分析、多元回归分析(线性回归、二元logistics回归),解释结果;

实验数据

1.对八块油茶树进行测量,计单位面积株数为x1,每株果实量为x2,单位面积产油量为y,测得数据如下:

  x1

10

12

9

12

11

9

10

10

x2

6

6

7

6.5

6.5

7

6.5

7

y

1.9

2.2

1.9

2.15

2.2

1.85

1.8

2.0

试建立y对x1,x2的线性回归方程,并进行检验。

2.试求一个厂家, 5个月中产品的广告费用与销售额之间的一元二次回归模型。其中,产品的广告费用与销售额的抽样数据为:

Y:广告费用

1000

1250

1500

2000

25000

X:销售额

101000

116000

165000

209000

264000

试建立销售额与广告费的一元二次回归模型,并检验判断是否有实际意义。

3.现有15名不同程度的烟民的每日饮酒(啤酒)量与其心电图指标(zb)的对应数据。烟民的每日饮酒(啤酒)量与其心电图指标(zb)的对应数据

试建立拟合这些数据的模型。4.检验专业核心课程成绩某一门课程与75分是否有显著性差异;

某2门课程成绩差异是否显著

5. 检验以下数据的药物治疗效果是否有显著差异

实验前预习:

1. 单样本t检验、两样本t检验、配对样本t检验的基本原理为,软件操作步骤;

2. 单因素方差分析基本原理为,软件操作步骤;

3. 多元回归分析(线性回归、二元logistics回归)基本原理为,软件操作步骤。

程序测试、运行结果及分析:

  • T检验
  • 单样本t检验

(检验专业核心课程成绩某一门课程与75分是否有显著性差异)

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“比较平均值” à 选择“单样本t检验” à 拖动高代1至检验变量框 à 在检验值框输入75 à点击“选项” à 在置信区间百分比框输入95à 点击“继续”和“确定”

运行结果:

单样本检验

检验值 = 75

t

自由度

Sig.(双尾)

平均值差值

差值 95% 置信区间

下限

上限

高代1

-3.093

31

.004

-5.78125

-9.5932

-1.9693

结果分析:

T检验的p值是0.004,小于显著性水平0.05,拒绝原假设(即没有显著性差异)因此可以认为高代1成绩的总体均值与75分有显著性差异。

单样本t检验是利用总体的样本数据,推断总体均值与指定检验值之间是否有显著差异,也就是对总体均值的假设检验,注意其数据必须服从正态分布。(比如检验一批零件是否正常)

  • 两样本t检验

(某2门课程成绩差异是否显著)

操作步骤:

打开spss软件 à 在“变量视图”名称列分别输入成绩和科目类别 à 在科目类别的“值”框定义1为高代1,2为高代2 à 在“数据视图”分别将高代1和高代2的成绩复制到成绩列à 在科目类别列,高代1所对应的行输入1,高代2所对应的行输入2 à点击“分析”à 点击“比较平均值” à 选择“独立样本t检验” à 拖动成绩至检验变量框,科目类别拖动至分组变量框à 点击“定义组”并分别输入1和2à点击“选项” à 在置信区间百分比框输入95à 点击“继续”和“确定”

运行结果:

独立样本检验

莱文方差等同性检验

平均值等同性 t 检验

F

显著性

t

自由度

Sig.(双尾)

平均值差值

标准误差差值

差值 95% 置信区间

下限

上限

成绩

假定等方差

.611

.437

.013

62

.990

.031

2.469

-4.904

4.966

不假定等方差

.013

60.701

.990

.031

2.469

-4.906

4.968

结果分析:

无论方差是否相等,其p值是都为0.990均大于显著性水平0.05,接受原假设(即没有显著性差异)因此可以认为高代1与高代2的成绩没有显著性差异。

两(独立)样本t检验就是利用两个总体的独立样本,推断两个总体的均值是否有显著性差异。注意两数据必须是独立的(比如检验两个行业的工资是否有显著性差异)

  • 配对样本t检验

(学生考不同课程成绩是否由显著差异。)

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“比较平均值” à 选择“成对样本t检验” à 拖动高代1和高代2至配对变量框 à点击“选项” à 在置信区间百分比框输入95à 点击“继续”和“确定”

运行结果:

配对样本检验

配对差值

t

自由度

Sig.(双尾)

平均值

标准 偏差

标准 误差平均值

差值 95% 置信区间

下限

上限

配对 1

高代1 - 高代2

.03125

9.15982

1.61924

-3.27122

3.33372

.019

31

.985

结果分析:

由表知,t检验的p值为0.985大于显著性水平0.05,说明拒绝原假设出错的概率较大,所以选择接受原假设(即没有显著性差异),可以认为同一个学生考高代1和高代2成绩的没有显著性差异。两配对样本t检验就是利用两个总体的配对样本推断总体均值是否存在显著差异(比如检验两公司对同一个数据的评估是否有差异,或者同一个学生考不同科目成绩是否由显著差异。)注意数据必须是随机的。

  • 方差分析
  • 单因素方差分析

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“比较平均值” à 选择“单样本ANOVA检验” à 拖动药物种类拖入因子框,将治愈天数拖入因变量框à点击“选项” à “确定”(注意填写数据时,一列为药物种类,一类为治愈天数,并将药物种类列填写1,2,3,4,5分别代表药物1,药物2,药物3,药物4,药物5)

运行结果:

ANOVA

治愈天数 

平方和

自由度

均方

F

显著性

组间

36.467

4

9.117

3.896

.014

组内

58.500

25

2.340

总计

94.967

29

结果分析:

单因素方差分析用于分析单个控制因素取不同水平时,因变量的均值是否存在显著性差异(比如分析不同种类机器的平均产量是否有显著性差异)

由结果可知,p值为0.014小于显著性水平0.05,所以拒绝原假设出错的概率小,拒绝原假设(没有显著性差异),可以认为不同药物种类的平均治愈天数有显著性差异。

  • 多因素方差分析

现有15名不同程度的烟民的每日饮酒(啤酒)量与其心电图指标(zb)的对应数据。烟民的每日饮酒(啤酒)量与其心电图指标(zb)的对应数据

试建立拟合这些数据的模型。

操作步骤:

打开spss软件 à 在“变量视图”名称列分别输入心电指标和日吸烟量以及日饮酒量, à 在“数据视图”输入题目数据à点击“分析”à 点击“一般线性模型” à 选择“单变量” à 拖动心电指标至因变量列表框,日吸烟量和日饮酒量拖动至固定因子框à 点击“事后比较”并在显著性水平框输入0.05 à 点击“继续”和“确定”

运行结果:

主体间效应检验

因变量:   心电指标

III 类平方和

自由度

均方

F

显著性

修正模型

94840.000a

13

7295.385

145.908

.065

截距

1645099.912

1

1645099.912

32901.998

.004

日吸烟量

2183.333

5

436.667

8.733

.251

日饮酒量

850.000

3

283.333

5.667

.297

日吸烟量 * 日饮酒量

.000

0

.

.

.

误差

50.000

1

50.000

总计

1901025.000

15

修正后总计

94890.000

14

结果分析:

多因素方差分析用于分析多个控制变量影响下的样本之间均值是否存在显著性差异(比如考察对纤维弹性的影响,多个因素是否有显著影响)由上表可知,日吸烟量因素的p值为0.251大于显著性水平0.05,接受原假设(没有显著影响),可以认为日吸烟量和心电指标没有显著性影响,同样日饮酒量的p值为0.297,其对心电指标也没有显著性影响。

  • 回归分析
  • 线性回归
  1. 直线:

对八块油茶树进行测量,计单位面积株数为x1,每株果实量为x2,单位面积产油量为y,测得数据如下:

x1

10

12

9

12

11

9

10

10

x2

6

6

7

6.5

6.5

7

6.5

7

y

1.9

2.2

1.9

2.15

2.2

1.85

1.8

2.0

试建立y对x1,x2的线性回归方程,并进行检验。

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“回归” à 选择“线性” à 拖动x1和x2至自变量并且将y拖入因变量框 à 点击“确定”

运行结果:

模型摘要

模型

R

R

调整后 R

标准估算的错误

1

.878a

.771

.679

.09210

a. 预测变量:(常量), 每株果实量x2, 单位面积株数x1

系数a

模型

未标准化系数

标准化系数

t

显著性

B 的 95.0% 置信区间

B

标准错误

Beta

下限

上限

1

(常量)

-.171

1.000

-.171

.871

-2.742

2.401

单位面积株数x1

.141

.038

1.027

3.721

.014

.043

.238

每株果实量x2

.109

.107

.279

1.011

.359

-.168

.385

结果分析:

从运行结果可知常量p=0.871>0.05及x2:p=0.359>0.05,说明其不显著,则每株果实量x2对产单位面积油量y没有影响;而x1:p=0.014<0.05,则说明其显著。

所以重新建立单位面积油量y与单位面积株树x1的回归方程得到结果:

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准错误

Beta

1

(常量)

.792

.306

2.584

.042

x1

.116

.029

.851

3.966

.007

a. 因变量:y

此时,常量和x1的p值均小于0.05,说明其具有显著性,得到最终回归方程为

y=0.116x1+0.792

模型摘要

模型

R

R 方

调整后 R 方

标准估算的错误

1

.851a

.724

.678

.09226

a. 预测变量:(常量), x1

对回归方程进行显著性检验R和R方都大于0.7达到显著水平,说明其具有实际意义。

  1. 曲线:

试求一个厂家, 5个月中产品的广告费用与销售额之间的一元二次回归模型。其中,产品的广告费用与销售额的抽样数据为:

Y:广告费用

1000

1250

1500

2000

2500

X:销售额

101000

116000

165000

209000

264000

试建立销售额与广告费的一元二次回归模型,并检验判断是否有实际意义。

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“回归” à 选择“曲线估计” à 拖动广告费和销售额分别自变量和因变量框 à模型框点击“二次项” à 点击“确定”

运行结果:

模型汇总和参数估计值

因变量: 销售额Y

方程

模型汇总

参数估计值

R

F

df1

df2

Sig.

常数

b1

b2

二次

.988

79.962

2

2

.012

-29417.910

132.910

-.006

自变量为 广告费用X

结果分析:

由表可知得到广告费x和销售额y之间的关系为:

Y=132.910x-0.006x^2-29417

对方程进行显著性检验,其R方为0.988大于0.7说明其有极显著性,所以有实际意义

讨论:

1.T检验

单样本t检验是利用总体的样本数据,推断总体均值与指定检验值之间是否有显著差异,也就是对总体均值的假设检验,注意其数据必须服从正态分布。(比如检验一批零件是否正常)P小,拒绝H0的出错概率就小,所以拒绝,P大,拒绝H0出错的概率就大,所以接受

两(独立)样本t检验就是利用两个总体的独立样本,推断两个总体的均值是否有显著性差异。注意两数据必须是独立的(比如检验两个行业的工资是否有显著性差异)

两配对样本t检验就是利用两个总体的配对样本推断总体均值是否存在显著差异(比如检验两公司对同一个数据的评估是否有差异,或者同一个学生考不同科目成绩是否由显著差异。)注意数据必须是随机的。

2.方差分析

单因素方差分析用于分析单个控制因素取不同水平时,因变量的均值是否存在显著性差异

多因素方差分析用于分析多个控制变量影响下的样本之间均值是否存在显著性差异

3,回归分析

Logistic回归其本质就是非线性回归,应用于检验因果关系或者预测,其有三种变量类型

二分类(判断有和无)

有序多分类(满意 基本满意 不满意)

无序多分类(坐飞机 坐火车 坐高铁)

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
SPSS经典教材之一。本书主要针对SPSS 的中、高级用户,定位为应用统计专业的研究生教材和其他专业的统计分析参考书。它以SPSS 12.0 的功能为准,以统计理论为主线,详细介绍了SPSS 中的各种多变量统计模型和多元统计分析方法。在保持全书简明易懂风格的基础上,对统计理论作了详细的讲解。全书内容共分四大部分:第一部分讲解了一般线性模型和混合线性模型,并重点对前者中的方差分析模型进行了介绍;第二部分则在此基础上进一步介绍了回归模型,包括对连续因变量建模的线性回归模型、线性回归的衍生模型、通径分析模型和非线性回归模型,以及对分类因变量建模的Logistic 模型族和Probit 模型;第三部分系统介绍了因子分析、判别分析、对应分析、多维尺度分析等多元统计方法的原理及其在SPSS 中的实现;第四部分则对信度分析、生存分析、缺失值分析方法等较难归类,但又比较重要的统计分析方法进行了讲解。各章后均提供了参考文献和思考练习题,书后附录则以流程图的方式提纲草领地给出了统计方法的分类体系,便于读者理解。另外,为便于读者自行对比分析结果,书中大部分表为SPSS 自动生成的。因此,大部分表及表题为英文。 需要指出的是,作为本套丛书的通用统计教材,本高级教程严格遵循了统计理论这一主线,在统计方法的纳入上是有所选择的。方法体系中比较特殊的时间序列模型并未纳入本书范畴,另有分册专门介绍;而对于联合分析、多维偏好分析、离散选择分析等在方法原理上并无特别之处,行业应用特点明显的模型,则将被放在相应的行业应用分册中讲解,本书不再专门介绍。除作为各专业研究生的统计教材和参考书外,本书还适用于各行业中希望深入学习和应用高级统计分析方法的读者。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

君无戏言。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值