“傻瓜”学计量——OLS1(变量及模型的选取、回归结果3000字超详细解读)

本文详细解析了多元回归中的自变量、因变量、控制变量的概念,探讨了多重共线性问题的检测与处理,以及不同类型的回归模型(如OLS、Logit/Probit、ologit/mlogit、Poisson)的选择和使用。此外,还涵盖了回归结果的解读,包括R-squared、调整R-squared、F检验、t统计量和置信区间的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提纲:

自变量和因变量

控制变量   (选择 多重共线性 stata检验多重公共线性)

各模型的适用条件

回归结果解读

自变量因变量

1.1要知道谁是“”谁是“

举例:

在一般的多元线性回归模型中,重要的自变量放前面,叫做“主要自变量”,如下图所示:

2 控制变量

2.1 关于控制变量的几个问题

2.1.1 控制变量是自变量嘛?

2.1.2 控制变量与主要自变量可以互换位置吗?

可以,并不影响回归结果。但是一般来说不这么做。

2.1.3 两者区别是什么?

因果关系。主要自变量是我们想要研究的,后面还要解释与Y的因果关系。而控制变量只要不影响回归结果就可以了。

2.2 如何选择控制变量?

按照自己的领域,多看前人的文献进行选择。

2.3 多重共线性

2.3.1 如果控制变量之间,存在高度相关or完美相关,即该模型存在多重共线性问题。

如果两个控制变量之间存在多重共线性问题,则该变量之前的系数就会出现误差,其实际经济意义不准确。

2.3.2 多重共线性的检验

(1)容忍性(Tolerance)
(2)方差膨胀系数(vif,variance inflation factor)        

stata操作如下:

regress 因变量 自变量                       进行OLS回归

estat vif                                               计算方差膨胀系数的指令

若回归结果vif值>10,则存在多重共线性问题。

3 如何选择模型(根据因变量Y)


先来个总结,方便大家对比记忆


3.1 几种模型及使用条件

3.1.1.y是连续变量:OLS模型

(1)注意:

(不用严格连续,如人民币单位“元”)

(误差项符合正态分布)

(2)stata指令

reg 因变量 自变量                        进行OLS的回归

(3)结果解读

最后一行“cons",全称“constant",是指常数项,对应的是\beta0。

第三列"t",看这个回归系数是否显著。

3.1.2 y是0-1变量:Logit/Probit回归

(1)注意:
Logit 和 Probit 的适用条件
假设\xi服从什么分布
Logit logistic分布
Probit 正态分布

一般实证中,logit使用较多。因为比较好解读。

(2)stata指令

logit 因变量 自变量

probit 因变量 自变量

3.1.3 y是分类变量:ologit或者mlogit回归

ologit和 mlogit回归 的适用条件
分类变量
ologit 有序
mlogit回归 无序

3.1.4 y是计数变量:poisson回归(stata指令相同)

计数变量(count variable):例如,多少人、多少次、多少天

计数变量的特点:整数    非负数     

各种模型使用条件已经放在本节开头⬆

4 回归结果解读(超详细)

4.1 上半部分

主要汇报:回归模型的拟合程度、一些针对模型的指标

4.1.1 左侧ÿ

对于OLS回归模型的初者,以下是一些学习介绍的主要内容: 1. OLS回归模型OLS回归模型是最常用的线性回归模型之一。它基于最小二乘法,通过拟合一个线性方程来建立自变量和因变量之间的关系。 2. 模型参数:通过使用OLS模型对象的`model.params`属性,可以提取回归模型的系数,即自变量的权重。这些参数表示自变量对因变量的影响程度。 3. 模型拟合:使用OLS模型对象的`.fit()`方法对数据进行回归拟合。该方法对输入的自变量和因变量执行线性回归计算,并返回一个`RegressionResultsWrapper`对象,包含了拟合结果的摘要。 4. 拟合结果摘要:通过调用拟合结果对象的不同属性,可以获取模型的各种统计信息。例如,`model.bse`提供了回归系数的标准误差,`model.pvalues`提供了回归系数的p值,`model.tvalues`提供了回归系数的t值等等。 5. 模型预测:使用拟合结果对象的`model.fittedvalues`属性,可以获取模型对样本数据的预测值。这些预测值表示模型对未知样本的预测结果。 6. 残差分析:通过使用拟合结果对象的`model.resid`属性,可以获取模型的残差。残差是实际观测值与模型预测值之间的差异,用于评估模型的拟合效果。 7. 模型评估:可以使用拟合结果对象的其他属性和方法来评估模型的好坏。例如,可以使用`model.summary()`方法来获取模型的详细摘要,包括R-squared值、调整R-squared值、F统计量等等。 要开始学习OLS回归模型,可以使用Python中的`statsmodels`库。通过创建一个OLS模型对象,并使用适当的自变量和因变量数据进行拟合,可以开始研究和分析回归模型结果。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [OLS回归分析原理实战及结果解析-python3](https://blog.csdn.net/qq_30868737/article/details/109164548)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python Statsmodels 统计包之 OLS 回归](https://blog.csdn.net/weixin_39826089/article/details/111558740)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值