回归系数的解释
y
i
=
β
0
+
β
1
x
1
i
+
β
2
x
2
i
+
⋯
+
β
k
x
k
i
+
μ
i
y
i
=
β
0
^
+
β
2
^
x
2
i
+
⋯
+
β
k
^
x
k
i
β
0
^
的
数
值
意
义
一
般
不
考
虑
,
因
为
所
有
的
自
变
量
一
般
不
会
同
时
全
为
0.
β
m
^
(
m
=
1
,
2
,
⋯
,
k
)
:
控
制
其
他
自
变
量
不
变
的
情
况
下
,
x
m
i
每
增
加
一
个
单
位
,
对
y
i
造
成
的
变
化
。
实
际
上
可
以
用
数
学
中
的
偏
导
数
来
定
义
:
β
m
^
=
∂
y
i
∂
x
m
i
y_i=\beta_0+\beta_1x_{1i}+\beta_2x_{2i}+\cdots+\beta_kx_{ki}+\mu_i\\y_i=\hat{\beta_0}+\hat{\beta_2}x_{2i}+\cdots+\hat{\beta_k}x_{ki}\\\hat{\beta_0}的数值意义一般不考虑,因为所有的自变量一般不会同时全为0.\\\hat{\beta_m}(m=1,2,\cdots,k):控制其他自变量不变的情况下,x_{mi}每增加一个单位,对y_i造成的变化。\\ 实际上可以用数学中的偏导数来定义:\hat{\beta_m}=\frac{\partial{y_i}}{\partial x_{mi}}
yi=β0+β1x1i+β2x2i+⋯+βkxki+μiyi=β0^+β2^x2i+⋯+βk^xkiβ0^的数值意义一般不考虑,因为所有的自变量一般不会同时全为0.βm^(m=1,2,⋯,k):控制其他自变量不变的情况下,xmi每增加一个单位,对yi造成的变化。实际上可以用数学中的偏导数来定义:βm^=∂xmi∂yi
因
此
多
元
线
性
回
归
模
型
中
的
回
归
系
数
,
也
常
被
称
为
偏
回
归
系
数
。
因此多元线性回归模型中的回归系数,也常被称为偏回归系数。
因此多元线性回归模型中的回归系数,也常被称为偏回归系数。
什么时候取对数
- 与市场价值相关的,例如,价格、销售额、工资等都可以取对数;
- 以年度量的变量,如受教育年限、工作经历等通常不取对数;
- 比例变量,如失业率、参与率等,两者均可;
- 变量取值必须是非负数,如果包含0,则可以对y取对数ln(1+y);
取对数的好处
- 减弱数据的异方差性。
- 如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布。
- 模型形式的需要,让模型具有经济学意义。
四种模型回归系数的解释
特殊的自变量:虚拟变量x
如果自变量中又定性变量,例如性别、地域等,在回归中需要如何处理呢?
虚拟变量的解释
为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1