“傻瓜”学计量——OLS1（变量及模型的选取、回归结果3000字超详细解读）

nn坚持学stata+matlab

已于 2024-04-22 18:08:51 修改

阅读量1.3w

点赞数 34

分类专栏：计量文章标签： python 机器学习学习方法笔记学习生活大数据

于 2024-02-27 16:13:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nnpersistent/article/details/136323825

版权

本文详细解析了多元回归中的自变量、因变量、控制变量的概念，探讨了多重共线性问题的检测与处理，以及不同类型的回归模型（如OLS、Logit/Probit、ologit/mlogit、Poisson）的选择和使用。此外，还涵盖了回归结果的解读，包括R-squared、调整R-squared、F检验、t统计量和置信区间的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

提纲：

自变量和因变量

控制变量（选择多重共线性 stata检验多重公共线性）

各模型的适用条件

回归结果解读

1 自变量与因变量

1.1要知道谁是“因”谁是“果”

举例：

在一般的多元线性回归模型中，重要的自变量放前面，叫做“主要自变量”，如下图所示：

2 控制变量

2.1 关于控制变量的几个问题

2.1.1 控制变量是自变量嘛？

是

2.1.2 控制变量与主要自变量可以互换位置吗？

可以，并不影响回归结果。但是一般来说不这么做。

2.1.3 两者区别是什么？

因果关系。主要自变量是我们想要研究的，后面还要解释与Y的因果关系。而控制变量只要不影响回归结果就可以了。

2.2 如何选择控制变量？

按照自己的领域，多看前人的文献进行选择。

2.3 多重共线性

2.3.1 如果控制变量之间，存在高度相关or完美相关，即该模型存在多重共线性问题。

如果两个控制变量之间存在多重共线性问题，则该变量之前的系数就会出现误差，其实际经济意义不准确。

2.3.2 多重共线性的检验

（1）容忍性（Tolerance）

（2）方差膨胀系数（vif,variance inflation factor）

stata操作如下：

regress 因变量自变量进行OLS回归

estat vif 计算方差膨胀系数的指令

若回归结果vif值>10,则存在多重共线性问题。

3 如何选择模型（根据因变量Y）

先来个总结，方便大家对比记忆

3.1 几种模型及使用条件

3.1.1.y是连续变量：OLS模型

（1）注意：

（不用严格连续，如人民币单位“元”）

（误差项符合正态分布）

（2）stata指令

reg 因变量自变量进行OLS的回归

（3）结果解读

最后一行“cons",全称“constant",是指常数项，对应的是 $\beta$ 0。

第三列"t",看这个回归系数是否显著。

3.1.2 y是0-1变量：Logit/Probit回归

（1）注意：

Logit 和 Probit 的适用条件
	假设 $\xi$ 服从什么分布
Logit	logistic分布
Probit	正态分布

一般实证中，logit使用较多。因为比较好解读。

（2）stata指令

logit 因变量自变量

probit 因变量自变量

3.1.3 y是分类变量：ologit或者mlogit回归

ologit和 mlogit回归的适用条件
	分类变量
ologit	有序
mlogit回归	无序

3.1.4 y是计数变量：poisson回归（stata指令相同）

计数变量（count variable）:例如，多少人、多少次、多少天

计数变量的特点：整数非负数

各种模型使用条件已经放在本节开头⬆

4 回归结果解读（超详细）

4.1 上半部分

主要汇报：回归模型的拟合程度、一些针对模型的指标

4.1.1 左侧ÿ

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。