终于搞懂什么是多元统计分析

本文介绍了多元统计分析的基本概念,包括其在经济社会研究中的应用,以及描述性和解析性方法的区别,如主成分分析、因子分析、聚类分析和多元回归分析。通过实例展示了如何运用多元统计分析方法如柯布—道格拉斯生产函数研究经济增长驱动因素。
摘要由CSDN通过智能技术生成

39f243c13df6ed5fd964521906bf9065.png

来源:爱数据LoveData‍‍‍‍‍‍‍‍‍‍‍‍
本文约2700字,建议阅读5分钟
本文介绍了多元统计分析。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

观察经济社会活动往往需要用到多项统计指标,如考察国家宏观经济运行状况,通常会用到国内生产总值、失业率、居民消费价格、进出口等指标,这些指标间一般存在内在的联系,研究多项指标间的相互依赖关系和内在统计规律性是多元统计分析的基本内容。 

01 什么是多元统计分析

多元统计分析是经典统计学发展起来的一个分支,是一种多指标(也称多变量)综合分析方法,可以在多指标相互关联情况下分析其统计规律,在研究经济社会现象中具有广泛应用。

在研究经济社会现象时,会收集大量个体的多方面信息,特别是随着信息化发展,采集到个体数量和指标数量大为增加,比如网上商品交易系统采集到的信息涉及的用户数以亿计,指标数量成百上千,这些都增加了分析的难度。对这些规模宏大、复杂难辨的信息进行提炼简化,提取重要信息辅助决策,是多元统计分析的重要应用领域。同时,经济社会现象间往往存在紧密的联系,表现为统计指标之间存在相关性、因果关系等,使用多元统计分析有助于研究统计指标间的内在联系,发现经济社会现象的内在规律性。

在实际观测和调查中,统计指标的取值一般是随机的,因此统计指标可以用随机变量来表示,那么多个统计指标对应多个随机变量。而多个随机变量组成的数据集合称为随机向量,随机向量服从一定的统计分布,这是多元统计分析方法建立的重要基础。

多元统计分析是指研究多个变量之间的相互关系和作用的统计方法。它可以通过分析多个变量的数据,揭示它们之间的关联、差异和影响。

多元统计分析包括多元方差分析、多元回归分析、主成分分析、因子分析、判别分析等方法。这些方法可以帮助研究人员理解变量之间的联结关系、预测变量间的变化、发现变量的隐藏结构等。

多元统计分析的优点在于能够同时考虑多个变量之间的关系,可以提供更全面和准确的信息。它适用于各种科学研究领域,如社会科学、医学、生物学等。今天我们就来了解一下多元统计分析的几个常用方法吧:

           dc0a5c5394017ed46ef9731373eb2381.png

02 多元统计分析法的分类

多元统计分析方法按照分析特点大致可以分为两类:一是描述性方法,主要从原始数据中提取重要信息,对系统主要特征进行研究,包括主成分分析、因子分析、聚类分析、对应分析等。二是解析性方法,主要是研究变量间相关关系、因果关系等,通过建立模型对变量间的关系认识定量化,包括多元回归分析、判别分析、典型相关分析等。

(一)描述性方法

1. 主成分分析

在研究多指标(变量)问题时,由于指标间存在一定相关性,导致信息冗余, 增加分析的难度。对此,主成分分析通过将原有的多个变量进行线性变换,组合成几个较少新的相互无相关性的综合变量,尽可能提取原有变量信息,达到指标简化目的。比如,在进行地区发展综合评价时,往往会选取经济增长、科技创新、人民生活、生态环境等多项指标,而这些指标往往存在相关性,通过主成分分析将这些指标简化为一到两个综合指标,将有助于降低综合评价难度。

2. 因子分析

因子分析是主成分分析的推广,将具有复杂关系的多变量转化为数量较少的几个综合变量,从而用有限个不可观测的隐变量来解释原始变量间相关关系。比如,在研究人体交感神经和副交感神经对人体的影响时,通常采集收缩压、舒张压、心跳间隔、呼吸间隔、舌下温度 5 个指标,通过因子分析可以将这 5 个指标综合为两个隐变量指标,从而反映交感神经和副交感神经的影响,找到其与原始 5 个指标的联系。

3. 聚类分析

聚类分析是将具有相似特征的个体归为一类,从而使同类的个体相似性较高, 而不同类的个体之间差异较大。衡量个体之间相似性采用“距离”测度和相似系数, 常用的“距离”测度有明式距离、马氏距离、兰氏距离,常用的相似系数有夹角余弦、相关系数。聚类分析中常用的方法有系统聚类、动态聚类等。比如,对全国省区市经济类型进行分类时,一般会选取一些的经济指标,然后利用这些经济指标计算地区与地区之间的“距离”,将“距离”近的地区归为一类,将“距离” 远的地区归为不同类别,从而形成不同地区经济发展水平类别,深化对地区经济的认识。

(二)解析性方法

1. 多元回归分析

多元回归分析是研究一个因变量与多个解释变量之间相互依存关系,揭示因变量与解释变量间的数量关系,从而对因变量进行估计或预测。比如,在预测长期经济增长趋势时,通常使用国内生产总值作为因变量,资本存量、就业人数、人力资本存量、制度变量等作为自变量,利用多元回归方法建立经济增长与相关因素的定量模型,利用得到的模型关系对未来经济增长趋势进行预测。

2. 判别分析

判别分析是判别观察个体所属类别的一种统计分析方法,它是在已知观察个体分为若干个类别的条件下,通过建立判别规则,对观察个体进行判别分类。它与聚类分析最大不同是,聚类分析事先不知道观察个体有多少个类别,而判别分析事先已知观察个体的类别个数。常用的判别分析法有距离判别法、费舍尔判别法、贝叶斯判别法等。比如,世界银行将全球国家划分为高收入国家、中高收入国家、中低收入国家、低收入国家四种类型,当判断一个国家属于哪种类型时, 可以使用判别分析方法建立规则进行判别。

03 示例

为分析中国经济增长的驱动因素及其影响,基于柯布—道格拉斯生产函数, 建立多元回归测算模型:

                            dafdfae849f46f5ffaafffdb6be0d852.png

其中,Y、K、L 分别为总产出、资本投入、劳动投入,r 为技术进步率、t 为时间,α、β 分别为资本投入、劳动投入的弹性。假定技术进步率不为常数,将其设定为de80d0332ce8158f24190dfb1adb7f9e.png,其中分别029f72a96ccf411d75e8954f445a6596.png6e6827dfb972d0f70ff4a245aedd4b17.png第二产业和第三产业就业人员比例,带入上述生产函数,并假定规模报酬不变,即 α+β=1,可以得到:

                     a6c2ece98996ffbbfc1c6be345d2c93a.png

记 Y/L=y,K/L=k,取对数后对公式两边进行变换,可以得到:

考虑到变量非平稳性,对上式两边进行差分后回归测算,使用 1978—2013 年我国的国内生产总值、资本存量和就业人数等数据得到:

   cfa2ce78af4f492dabea3842a53b5fb0.png

多元回归检验结果表明,回归效果较好,上述模型能够满足分析经济产出、资本投入、劳动投入之间关系的需要。从回归结果来看,人均资本存量的提高有利于人均经济产出的增长。

经过本期详细介绍,辅以例题解释后,终于搞懂什么是多元统计分析啦,一时的懂不是永久的懂,实践永远是检验大量理论的唯一标准,希望小伙伴们还要勤加练习,把多元统计分析方法彻底搞懂503aa191bd6807252c7ddb15fde5bf7b.png

编辑:王菁

‍‍‍

4c31db2162b7eec81d5dd30718068e44.png

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值