上周因为等十元女士的新剧开播以及系里同学聚会的原因,更新复习笔记的进度有点滞后,今天的笔记接着复习第六章的内容。与前两章较多的统计学内容相比,这一章节算是比较简单了,主要涉及自变量形式的转换以及因变量的预测问题。如果有不明白的地方,写下公式,通过简单的运算即可明白背后的经济学含义。
一、改变变量单位
课本第六章第一部分的内容是关于数据单位的换算。举个简单的例子,假如我们在研究公司CEO的薪酬问题,年薪是我们的因变量。在我们的数据里,一般CEO年薪都是百万以上,那么在进行回归分析的时候,我们可以统一去掉六个零,使薪酬以百万为单位。通过简单的运算可知,单位改变后我们估计出来的系数值也会改变,但这并不会影响我们的分析结果。
下面我们以书中的婴儿出生重量数据为例进行演示,所用到的数据为bwght。原始数据中,因变量婴儿出生重量以盎司为单位,如果我们转而以磅(一磅约等于一盎司除以16)为单位,则我们的模型由
变为
### 导入伍德里奇数据包library(wooldridge)### 导入结果输出包library(stargazer)### 原始数据回归分析lm1 ### 改变因变量单位### 对公式里的变量进行运算时 用I()将其括起来### 也可以单独生成新的变量 bwghtlbs = bwght/16lm2 16) ~ cigs + faminc, data = bwght)### 导出结果stargazer(lm1, lm2, type = "text")
根据公式我们可知,左边的变量系数除以16应该约等于右边的变量系数。上面的例子是改变因变量的单位,如果我们改变自变量的单位,那么除了该自变量的系数会发生变化以外,其他均不会变化,当然最终的分析结果无论采用哪种模型都不会发生改变。举例说明,假如我们改变香烟的单位,以20支香烟为一包,则我们的模型由
变为
### 改变香烟的单位lm3 20) + faminc, data = bwght)### 导出结果stargazer(lm1, lm2, lm3, type = "text")
根据公式可知,改变香烟的单位以后,新的系数值应该为之前的系数值乘以20,根据回归分析的结果我们也可以发现,最左侧香烟的系数乘以20约等于最右侧新的香烟变量的系数。
二、系数的标准化
除了可以改变变量的单位,我们也可以通过一定的方法改变系数,将系数标准化主要是为了推断自变量标准差的变化对因变量标准