stata学习笔记|受限被解释变量

最新推荐文章于 2024-10-31 14:03:31 发布

Lennox_Artist

最新推荐文章于 2024-10-31 14:03:31 发布

阅读量5.5k

点赞数 2

分类专栏： stata学习笔记文章标签：回归经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Clytie_Lion/article/details/121365020

版权

stata学习笔记专栏收录该内容

12 篇文章

订阅专栏

受限被解释变量类型

普通断尾随机变量——断尾回归：对于分析的样本解释变量有上限或者下限的要求
零断尾计数数据——零断尾泊松回归和负二项回归：正整数
偶然断尾（自选择问题）——样本选择模型：因为某些原因，导致被解释变量的取值有所不同
归并数据——归并Tobit模型和跨栏模型：一个离散点和一个连续分布

普通断尾回归

ll(#)表示左边断尾，ul(#)表示右边断尾，两个都用则表示双边断尾。

truncreg y x1 x2 x3,ll(#) ul(#)

结果与普通回归没有很大区别。

零断尾泊松回归和负二项回归

样本中仅包括正整数，而不包括为0的样本（本身存在一定的样本选择问题），例如，在公交车上发放问卷调查每周乘坐公交车的次数。

第二个和第三个是负二项回归，其中第二个是默认的NB2模型，第三个是NB1模型。

ztp y x1 x2 x3,r

ztnb y x1 x2 x3,r

ztnb y x1 x2 x3,r disperision(constant)

偶然断尾回归

即被解释变量y的断尾与z变量相关，这被称为偶然断尾，即存在样本自选择问题。

类似于零断尾现象的存在，样本本身被选择就是由于某些其他因素的存在。

此时需要采取heckman两步法，第一步需要测算样本被选择的概率，第二步再对规律进行回归。

第一个为默认使用的MLE法进行测算的，第二个是Heckit的两步法，第三个是选择方程的被解释变量不再是y而是w。

heckman y x1 x2 x3,select(z1 z2)

heckman y x1 x2 x3,select(z1 z2) twostep

heckman y x1 x2 x3,select(w=z1 z2)

在最后一行的p值表示拒绝原假设，即应该选择样本选择模型。

归并回归

Tobit模型

当满足某个条件时，被解释变量的取值全部归为了一个数。

即被解释变量的分布变成了一个离散点和一个连续分布。

tobit y x1 x2 x3,ll(#) ul(#)

但是其对被解释变量的分布要求很高，需要服从同方差以及正态分布的特征。（最大似然估计的衍生）

用下面的方法对正态性进行检验。（需要在进行tobit回归之后使用）

tobcm,pbs

观察CM值，将其与各个百分比的数值进行对比，大于则拒绝原假设，即不认为其为正态分布。

或者可以采用clad方法，其对分布的要求较低。

clad y x1 x2 x3,ll(#) ul(#)

若进行CLAD法，发现其与Tobit存在较大差异，则表示确实不应当采用Tobit回归。

两部分模型

将决策分为两个阶段，第一个是是否会做这件事，第二个才是做这件事的结果数值大小。

即分别进行回归，首先第一阶段，生成一个被解释的虚拟变量，利用全样本进行Probit或者Logit回归。

gen newvar=(y>0)

probit y x1 x2 x3,nolog

第二阶段，利用被解释变量>0的子样本进行回归。

reg y x1 x2 x3 if y>0,r

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。