浙江工商大学813理学统计学复试常见问题整理总结——数理统计部分补充(方差分析与回归分析)

承接着数理统计的部分,今天分享一下方差分析与回归分析这块的内容,其实浙工商去年的复试专业课内容就不在局限于初试的茆书前七章了,(去年我复试时就抽到了回归分析那块的东西,问的是回归分析的基本假定以及所使用的方法)因此,有必要对茆书后面部分的东西进行一个复习。

方差分析部分

方差分析:

是用于检验多个总体的均值是否相等的显著性检验.名字是方差分析,其实主要是比较总体的均值,在判断均值是否有差异时要借助方差。

基本原理:

方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个:组内误差和组间误差,组内误差(随机误差)就是由于随机因素造成的组内随机误差,组间误差(实验条件)就是不同水平之间的误差.

基本思想:

方差分析通过平方和分解公式将总的误差为SST分解为组内误差SSE和组间误差SSA,即有SST=SSE+SSA,即通过分析研究不同来源的误差对总误差的影响大小,从而确定组间误差(实验条件或可控因素)对研究结果影响力的大小。

方差分析方法本质上就是从总偏差平方和分解出可追溯到指定来源的部分偏差平方和,这是一个很重要的思想。

应用:

通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。

回归分析

变量之间的关系一种是确定性的函数关系,另一类是不确定性的统计关系,也称为相关关系

1 相关分析与回归分析

相关分析:

研究变量相互之间的相关关系时,首先需要分析它们是否存在相关关系,然后要明确其相关关系的类型,而且还应计算其相关关系的密切程度,在统计学中这种研究称为相关分析。

相关分析主要是用一个指标(相关系数)去表明现象间相互依存关系的性质和密切程度。不过相关分析并不能说明变量间相关关系的具体形式,也还不能从一个变量的变化去推测另一个变量的具体变化。如果要具体测定变量之间相关关系的数量形式,还需要运用回归分析的方法。

回归分析:

回归是关于一个变量(被解释变量或应变量)对另一个或多个变量(解释变量)依存关系的研究,用适当的数学模型去近似地表达或估计变量之间的平均变化关系,其目的是要根据已知的或固定的解释变量的数值,去估计所研究的被解释变量的总体平均值。

应当注意回归所要揭示的是被解释变量与解释变量之间的平均关系。在这里,被解释变量是随机变量,解释变量在本质上可以是随机变量,但在回归分析中解释变量作为被解释变量变动的原因,我们总是假定在重复抽样中是取某些固定的值,所以在一般情况下解释变量是作为非随机变量来处理的。

联系:

(1)二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析去寻求相关的具体数学形式才有实际的意义。

(2)同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。

区别:

从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测被解释变量的平均值。

(2)从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分解释变量和被解释变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是建立在变量因果关系分析的基础上,研究其中解释变量的变动对被解释变量的具体影响,回归分析中必须明确划分被解释变量和解释变量,对变量的处理是不对称的。在回归分析中通常假定解释变量在重复抽样中是取固定值的非随机变量,只有被解释变量是具有一定概率分布的随机变量。

2 回归分析中的数据类别:

(1)时间序列数据

把反映某一总体特征的同一指标的数据,按照一定的时间顺序和时间间隔(如月度、季度、年度)排列起来,这样的统计数据称为时间序列数据。例如逐年的国内生产总值和消费支出、逐月的物价指数……等等。时间序列数据可以是时期数据,也可以是时点数据。

(2)截面数据

同一时间(时期或时点)某个指标在不同空间的观测数据,称为截面数据。“不同的空间”可以是指不同的地理区域,也可以是指不同的行业、部门或个人。例如,同一时间不同家庭的收入和消费支出、某一年各个省(市)的国内生产总值,等等。

(3)面板数据

面板数据指时间序列数据和截面数据相结合的数据,例如在居民收支调查中收集的对各个固定调查户在不同时期的调查数据,又如全国各省市不同年份的经济发展状况的统计数据,就都是面板数据。

(4)虚拟变量数据

时间序列数据和截面数据都是反映定量事实的数据,这是回归分析中用得最多的最基本的数据。但是还有一些定性的事实,不能直接用一般的数量去计量,例如政府政策的变动、自然灾害、政治因素、战争与和平状态……等等。在回归分析中常发现,某些客观存在的定性现象确实对所研究的经济变量有明显的影响,需要把它们引入回归分析中,这时常用人为构造的虚拟变量去表示这类客观存在的定性现象“非此即彼”的状态。通常以1去表示某种状态发生,以0表示该种状态不发生。这样的虚拟变量虽然是人为构造的,但反映了客观存在的定性现象,也可以视为一种数据用作模型参数的估计和检验。

3 简单线性回归的基本假定

(1)零均值假定

(2)同方差假定

(3)无自相关假定

(4)解释变量 与随机误差项 不相关假定。

(5)正态性假定

以上是部分方差分析与回归分析的在复试中容易被问到的知识点,想要获得所有复试资料,加QQ:2477447916

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值