目录
主要用途:
1.考查多个自变量与因变量的关系,同时获得其影响
2.考察控制一个或多个额外变量之后,一个或多个自变量与因变量的关系(层次回归/序列回归/R2改变量:自变量通过逐层进入方程,通过查看R2改变量即可了解新增加变量对因变量的影响程度)
3.考察新增一个或多个额外变量之后,新增的一个或多个自变量与因变量的影响大小
4.从多个自变量选出对因变量影响最大的几个自变量(逐步回归)
常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归 和生存回归。
这就是回归分析要完成的三个使命:
第一、识别重要变量;
第二、判断相关性的方向;
第三、要估计权重(回归系数)
线性回归
多种数据类型处理方法
宏观数据:知乎上搜“数据查找”
微观数据:在人大经济论坛搜索 https://bbs.pinggu.org
一元线性回归
使用线性回归模型前,先进行预处理
excel预处理:直接=要处理的数据和指令
回归系数解释
内生性,外生性
核心变量,控制变量
取对数
四种模型回归系数解释
虚拟变量
如果自变量中有定性变量,例如性别、地域等,在回归中要 使用虚拟变量
为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。
含有交互项的自变量
stata
数据的描述性统计
excel数据透视表(作图)
stata回归
1)regress y x1 x2 … xk
2)标准化回归
regress y x1 x2 … xk,beta
拟合优度R2太低
标准化回归系数
扰动项
异方差
检验异方差
stata
拟合出现负数原因
异方差假设检验
1)BP检验:Stata命令(在回归结束后使用)
estat hettest ,rhs iid
结果
2)怀特检验:Stata命令(在回归结束后使用)
estat imtest,white
结果:与0.05对比
异方差处理方法(加上推荐)
使用OLS + 稳健的标准误
regress y x1 x2 … xk,robust
检测多重共线性 在回归后
estat vif
多重共线性 解决
一般还是直接删数据
逐步回归分析
向前逐步回归Forward selection: stepwise regress y x1 x2 … xk, pe(#1)
向后逐步回归Backward elimination: stepwise regress y x1 x2 … xk, pr(#2)
#1,#2表示一个数,如果是向前的话,太严格就加不进来变量 ,增大#1,就可以增加变量数目, 如果是先后的话太严格就剔除不了变量,那基本都留下来了,可以减小#2,
注意