思想:
研究X和Y之间相关性的分析。
两套定义:X是自变量,Y是因变量;X是解释变量,Y是被解释变量。
作用:
通过研究X和Y的关系,解释Y的形成机制,进而通过X来预测Y。
线性回归的三个使命:识别重要变量;判断相关性的方向;估计权重(回归系数)。
数据分类:
横截面数据:同一时间,不同个体
时间序列数据 :同一个体,不同时间
面板数据:不同个体,不同时间
回归系数的解释:
例:(x为品质,y为销量)品质为0时,销量为,同时品质每提升一个单位,销量都会上涨.
内生性探究:
外生性:误差项与所有自变量x都没有关系。
内生性:反之。会导致回归系数估计不准确,不满足无偏和一致性。 误差项和x的相关系数越大,内生性越严重。也意味着,估计值和相关系数成正相关。
用蒙特卡洛模拟估计内生性的大小:
通过matlab画图,纵坐标是估计值,横坐标是相关系数。
弱化条件:
只要满足误差项和核心解释变量相关性为0就行,其余的为控制变量,把它们也放入回归方程是因为要控制住那些对被解释变量有影响的遗漏因素。