多元线性回归

目录

多种数据类型处理方法

使用线性回归模型前,先进行预处理 

 回归系数解释

 内生性,外生性

核心变量,控制变量

​ 取对数

 四种模型回归系数解释

虚拟变量

 含有交互项的自变量

stata

​ ​

 数据的描述性统计

 stata回归

 拟合优度R2太低​

 标准化回归系数

 扰动项

 异方差 

​检验异方差

​拟合出现负数原因 

​异方差假设检验

​ 异方差处理方法(加上推荐)

​使用OLS + 稳健的标准误

​检测多重共线性 在回归后

多重共线性 解决

​逐步回归分析


主要用途:

1.考查多个自变量与因变量的关系,同时获得其影响

2.考察控制一个或多个额外变量之后,一个或多个自变量与因变量的关系(层次回归/序列回归/R2改变量:自变量通过逐层进入方程,通过查看R2改变量即可了解新增加变量对因变量的影响程度)

3.考察新增一个或多个额外变量之后,新增的一个或多个自变量与因变量的影响大小

4.从多个自变量选出对因变量影响最大的几个自变量(逐步回归)

常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归 和生存回归。

这就是回归分析要完成的三个使命:

第一、识别重要变量;

第二、判断相关性的方向;

第三、要估计权重(回归系数)

线性回归

多种数据类型处理方法

宏观数据:知乎上搜“数据查找” 

微观数据:在人大经济论坛搜索 https://bbs.pinggu.org

一元线性回归

使用线性回归模型前,先进行预处理 

 excel预处理:直接=要处理的数据和指令

 回归系数解释

 内生性,外生性

 

核心变量,控制变量

 取对数

 四种模型回归系数解释

 

虚拟变量

如果自变量中有定性变量,例如性别、地域等,在回归中要 使用虚拟变量

  

为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。

 含有交互项的自变量

stata

 

 数据的描述性统计

 

 excel数据透视表(作图)

 stata回归

1)regress y x1 x2 … xk

2)标准化回归

regress y x1 x2 … xk,beta

  

 拟合优度R2太低

 标准化回归系数

 扰动项

 异方差 

检验异方差

stata 

拟合出现负数原因 

异方差假设检验

1)BP检验:Stata命令(在回归结束后使用)

estat hettest ,rhs iid

结果

2)怀特检验:Stata命令(在回归结束后使用)

estat imtest,white 

结果:与0.05对比

 异方差处理方法(加上推荐)

使用OLS + 稳健的标准误

regress y x1 x2 … xk,robust 

检测多重共线性 在回归后

estat vif

多重共线性 解决

一般还是直接删数据

逐步回归分析

向前逐步回归Forward selection: stepwise regress y x1 x2 … xk, pe(#1) 

向后逐步回归Backward elimination: stepwise regress y x1 x2 … xk, pr(#2)

 #1,#2表示一个数,如果是向前的话,太严格就加不进来变量 ,增大#1,就可以增加变量数目,  如果是先后的话太严格就剔除不了变量,那基本都留下来了,可以减小#2,

注意 

  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值