谢宇回归分析pdf_多元回归系数:我们都解释错了?

98408c8f622d7a760c5e576b943337da.png
作者:金钊 (中山大学) E-Mail: 980510243@qq.com

连享会-知乎推文列表


Note: 助教招聘信息请进入「课程主页」查看。

因果推断-内生性 专题 ⌚ 2020.11.12-15
主讲:王存同 (中央财经大学);司继春(上海对外经贸大学) 课程主页https://gitee.com/arlionn/YG | 微信版

d91614bfc369dc54ccecb53aefb19610.png
空间计量 专题 ⌚ 2020.12.10-13
主讲:杨海生 (中山大学);范巧 (兰州大学) 课程主页https://gitee.com/arlionn/SP | 微信版

3dfc4d50760a140602303abd8e231360.png

目录

  • 1. 引言
  • 2. 多元线性回归系数的常见误解
    • 2.1 多元线性回归计量模型
    • 2.2 多元线性回归系数的图形解释
    • 2.3 多元线性回归系数的代数和矩阵解释
    • 2.4 常见的错误解读
    • 2.5 正确的解释
  • 3. Stata 命令:margins 运用问题
  • 4. 小结
  • 参考文献
  • 附:文中所用代码
    • 课程一览

编者按: 在 Stata Journal ( 各期 SJ) 2016 年第 1 期中连续登载了 4 篇「 吵架」论文。其中,首篇为 David Hoaglin 撰写的长文 (p.5-22),题为「Regressions are Commonly Misinterpreted」。从标题上来看,这无异于「挑战」我们的常识。三位知名的计量经济学家 (James Hardin, Scott Long, David Drukker) 撰写了两篇短文对此进行评论/批评。而同期第四篇论文刊登的就是 David Hoaglin 的「反驳 (Rejoinder)」。显然,这四篇文章是 Stata Journal 的编辑们蓄意之作,同时,也凸显出此问题的重要性。本文对其中的一些核心观点进行梳理,感兴趣的读者可以阅读原文以便品尝原味红茶。
  • Hoaglin David C., 2016, Regressions are Commonly Misinterpreted, Stata Journal, 16(1): 5–22. [PDF]
  • Hardin James W. , 2016, Regressions are Commonly Misinterpreted: Comments on the Article, Stata Journal, 16(1): 23–24. [PDF]
  • Long J. Scott, David M. Drukker, 2016, Regressions are Commonly Misinterpreted: Comments on the Article, Stata Journal, 16(1): 25–29. [PDF]
  • Hoaglin David C., 2016, Regressions are Commonly Misinterpreted: A Rejoinder, Stata Journal, 16(1): 30–36. [PDF]
同主题阅读:
  • 连享会 - 回归分析专题
  • 图示线性回归系数:Frisch-Waugh定理与部分回归图
  • 多元回归系数:我们都解释错了?
  • 加入控制变量后结果悲催了!
  • 如何比较解释变量的系数相对大小?
  • R2分解:相对重要性分析 (Dominance Analysis)
  • 残差是个宝:盈余管理、过度投资、超额收益怎么算?

1. 引言

多元回归模型一直被广泛运用,也是最常见和最基础的计量模型。多元回归模型中各个变量间关系相对复杂,其回归系数惯常解释为:

当其他变量保持不变或控制其他变量不变时,
每改变一个单位时因变量
的平均变化量。

然而,Hoaglin (2016) 指出,这种常见的解读存在错误。这些问题常常出现在 OLS 回归、logistic 回归和其他广义线性模型以及生存分析、纵向分析和层次分析回归中。

Hoaglin (2016) 认为,这些解释既没有体现多元回归的基本原理,也不符合现实情况。他从图形、多元正态分布和最小二乘几何特征等角度解释「控制」和「保持不变」的不适性。为此,他们提出一直全新的解释「调整

和其他预测因子对
的共同线性影响后,
每改变一个单位时因变量
的平均变化量」。

2. 多元线性回归系数的常见误解

2.1 多元线性回归计量模型

我们常见的多元回归的总体 (population) 模型为:

其中,

为解释变量或预测因子;
为被解释变量或响应变量。我们通常令第一个解释变量为单位向量,即
为待估参数,称为「回归系数」(regression coefficients)。

在多元回归中,预测因子间不可能是完全独立的,每个回归系数的下标应该包含方程中的其他预测因子。为此,预测因子

的回归系数可以写为:
,第一个下标表示响应变量,第二个下标表示系数所附的预测因子,而在「·」之后的下标表示其他预测因子。则回归模型可以变为:

运用数据可以对回归系数

进行估计,可以得到估计值
。则 (2) 的拟合方程为:

为残差,
的观测值。在多元回归中,每个预测因子的系数都说明了其他预测因子的贡献,也就是说,它反映了对这些预测因子的调整。

2.2 多元线性回归系数的图形解释

我们运用 Stata 自带的 1978 汽车数据集 auto.dta 中的进口汽车 (foreign) 数据来解释多元回归系数估计值的含义。

首先,我们把汽车的百英里油耗 (100/mpg) 当作被响应变量,汽车的重量 (weight) 和排量 (displacement) 为预测因子。通过散点图 (图 1),我们可以看到汽车油耗与重量和排量的相关性很高,汽车的重量和排量的相关性也很强。

. sysuse auto, clear
(1978 Automobile Data)

. generate gp100m = 100/mpg

. label var gp100m "Gallons per 100 miles"

*-相关系数
. pwcorr gp100m weight displacement if foreign==1

             |   gp100m   weight displa~t
-------------+---------------------------
      gp100m |   1.0000 
      weight |   0.8172   1.0000 
displacement |   0.8444   0.9507   1.0000 

*-散点图矩阵
. graph matrix gp100m weight displacement if foreign==1

5256aadef39afa21324f5333ef9a2d80.png
图 1 汽车油耗、重量和排量的散点图矩阵

首先,我们看二元回归的估计结果如下,可以发现汽车重量回归系数的估计值为 0.396,而汽车排量回归系数的估计值为 0.032。

. regress gp100m weight displacement if foreign == 1

      Source |       SS       df       MS      Number of obs  =      22
   ----------+------------------------------   F(2, 19)       =   23.86
       Model |  19.6704568   
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《回归分析修订 谢宇 pdf》是一本关于回归分析方法的修订版书籍。回归分析是统计学中一种重要的数据分析方法,用于探索因变量与一个或多个自变量之间的关系。这本书的作者是谢宇,他通过修订这本书,可能是为了增加其准确性和有效性,以便更好地帮助读者理解和应用回归分析方法。 修订版的书籍往往会进行内容的更新和改进,包括可能修正之前版本中的误或不准确的信息,并添加最新的研究成果和案例研究。因此,这本修订版的《回归分析修订 谢宇 pdf》可能具有以下特点: 1. 修正误和提供更准确的信息:修订版可能会对之前版本中的误或不准确的内容进行修正,以确保读者得到准确和可靠的信息。 2. 添加最新的研究成果:回归分析是一个活跃的研究领域,在修订版中可能会添加最新的研究成果和进展,以反映该领域的最新发展。 3. 引入案例研究:修订版可能会增加一些实际应用的案例研究,帮助读者理解回归分析方法在实际问题中的应用。 4. 更新应用软件介绍:回归分析通常需要使用统计软件进行计算和分析,修订版可能会更新有关常用统计软件的介绍,以确保读者可以正确地使用这些软件进行回归分析。 总之,这本修订版的《回归分析修订 谢宇 pdf》可能是为了提供更准确和最新的回归分析方法,以满足读者在统计数据分析方面的需求。阅读这本修订版书籍,读者可以更好地理解和应用回归分析方法,从而在实际问题中做出准确的预测和推断。 ### 回答2: 《回归分析修订 谢宇pdf》是一本介绍回归分析的修订版电子书籍。回归分析是统计学中的一种重要分析方法,用于研究因变量与一个或多个自变量之间的关系。谢宇pdf以此为主题,对回归分析的原理、方法和应用进行修订和完善。 在这本修订版的电子书中,谢宇回归分析的基本原理进行了深入的讲解。首先,他介绍了线性回归模型,这是回归分析中最基础的模型,用于描述因变量与一个自变量之间的线性关系。然后,他讨论了多元回归模型,这是用于描述因变量与多个自变量之间的关系的模型。他详细讲解了多元回归模型的参数估计、假设检验和模型诊断等内容。 除了回归分析的基本原理外,谢宇还对回归分析的应用进行了补充。他介绍了在不同领域中回归分析的具体应用,例如经济学、医学和社会科学等。他还以实际案例为例,演示了如何使用回归分析来解决实际问题。 修订版的谢宇pdf相比于之前的版本,添加了一些新的内容和案例,以反映回归分析领域的最新发展。此外,他对之前版本中的误和不足进行了修正和改进,使得这本电子书更加全面和准确。 总之,《回归分析修订 谢宇pdf》是一本全面详细介绍回归分析的修订版电子书籍。通过阅读这本书,读者可以更加深入地理解回归分析的原理和方法,并掌握如何应用回归分析解决实际问题。 ### 回答3: 《回归分析修订 谢宇 pdf》是一本关于回归分析的修订版书籍。回归分析是统计学中用来探索两个或更多变量之间关系的方法。该书作者为谢宇,这本修订版的PDF文件相比之前的版本进行了一些改动和更新。 这本修订版通过对回归分析的基本概念和理论进行解释,帮助读者理解回归分析的原理和应用。它不仅适用于统计学专业的学生和研究人员,也适用于其他领域的人士,如经济学、金融学和社会科学等。 该书通过详细介绍回归模型的建立方法、参数估计、模型评估和解释,帮助读者了解如何使用回归分析来解决实际问题。它还探讨了线性回归和多元回归的应用,并介绍了常见的回归模型和假设检验的方法。 修订版对原有内容进行了更新和完善,包括添加了更多实例和案例研究,帮助读者更好地理解回归分析的实际应用。此外,修订版还加入了对一些新的回归方法和技术的介绍,如岭回归、逐步回归和非线性回归等,使读者能够更全面地了解回归分析的最新发展。 总之,这本修订版的《回归分析修订 谢宇 pdf》是一本系统而全面的回归分析教材,通过对回归分析的基本原理、方法和应用进行解释,帮助读者提高对回归分析的理解和应用能力。无论是学生、研究人员还是从事与统计相关工作的人士,都能从中获得有益的知识和指导。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值