logit回归模型_是或否,Logit模型详解以及论文实践

本文详细介绍了Logit和Probit模型的区别及其在社会科学中的应用。从二分类到多分类,再到次序及面板数据的Logit回归,文中通过具体实例展示了如何使用这些模型进行实证分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录 1.Logit和Probit的模型差别 2.二分类Logistic回归模型 3.多分类Logistic回归模型 4.次序Logistic回归模型 5.面板数据Logistic回归模型

Logit回归(又称逻辑回归、罗杰斯蒂回归、Logistic回归)无疑是社会科学,尤其是社会学研究中使用最广的方法,没有之一。这也是因为社会科学中变量的类型所决定的。因变量的类型决定着回归模型的使用,对于社会科学中常用的类别变量对应的就是Logit回归。

Logit回归又不同于一般线性回归,一般线性回归的回归系数以及R方等较容易解释,但是Logit回归的数学原理中涉及到了对数转换等,所以解释起来与一般线性回归有着较多的不同之处。

下面给一个具体的例子,研究的是某一地区农户耕种土地占总可耕种土地的情况。

95b53941d10056313b18b5e604ffff19.png

a43b35190618bf7f27550baf08572323.png

630a5350e5735391dfde88b72eae4e86.png

1.Logit和Probit的模型差别


Logit回归和Probit回归本质上都是对二分类变量进行转换,而且转换的关键都是针对事件发生的概率p。其中Logit模型是进行对数转换。

Probit模型顾名思义就是进行了Probit转换,Probit转换是得到一个关于p的单调函数,并且该函数和自变量呈线性关系。

2.二分类Logistic回归


sysuse "auto.dta",clear**一般Logistic回归logit foreign mpg weight**胜算比 (odds)获取的回归logit foreign mpg weight,or

61d89713fea79d059e38189d1b335b28.png

3.多分类Logistic回归

在计量经济学中,(多元)Logit模型是非常常用的建模离散选择的计量工具。Filip Matejka和 Alisdair McKay 2015年AER上的文章《Rational inattention to discrete choices: A new foundation for themultinomial logit model》通过不完全信息下「理性疏忽」的角度,提出了多元Logit 模型的一个新的基础。

在实证研究中,我们会遇到被解释变量为类别变量的情形。在部分情境下,被解释变量为非此即彼的二元选择变量 (如是否考取大学、是否结婚等),即我们熟知的0-1变量,此时应采用二元 Logit 模型进行估计;但在很多情形中,被解释变量涉及 3 种以上的类别变量。

**调用数据use https://stats.idre.ucla.edu/stat/data/hsbdemo,clear**logit回归mlogit prog schtyp read write math science socst honors,or** ses 变量前的i.标识表明该变量为类别变量,base选项帮助我们选定模型估计的基准组,此处我们将「学术课程项目」( ses=2 ) 作为基准组。mlogit prog i.ses write, base(2)

d9177795f6a981ea4e094f2e19e7cf2e.png

**计算所有系数估计值对应的胜算比mlogit, rrr

4464735412dc193543b35162b53f76d2.png

**预测概率值与概率值的图形显示margins ses, atmeans predict(outcome(1))marginsplot, name(general) margins ses, atmeans predict(outcome(2))marginsplot, name(academic) margins ses, atmeans predict(outcome(3))marginsplot, name(vocational) graph combine general academic vocational, ycommon

e44da3554d57e116394ee3f7d4239f45.png

下面讨论连续变量 write 在不同取值情况下对应的平均预测概率,平均预测概率为不同 ses 层级对应的预测概率的平均值。

margins, at(write = (30(10) 70)) predict(outcome(1)) vsquishmargins, at(write = (30(10) 70)) predict(outcome(2)) vsquishmargins, at(write = (30(10) 70)) predict(outcome(3)) vsquishredict p1 p2 p3sort writetwoway (line p1 write if ses ==1) (line p1 write if ses==2) (line p1 write if ses ==3), legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1)) title("general")twoway (line p2 write if ses ==1) (line p2 write if ses==2) (line p2 write if ses ==3), legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1)) title("academic")twoway (line p3 write if ses ==1) (line p3 write if ses==2) (line p3 write if ses ==3), legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1)) title("vocation")

b022e257a528c1b2782d793b554c534c.png

255b28215e569998612b881de5edca87.png

66d4e914552c0105cef2cc2eb240dd17.png

4.次序Logistic回归
webuse lbw,clear** low为应变量,后边均为自变量,OR为各变量回归系数的对数值logit low age lwt i.race smoke ptl ht ui,or**使用Hl检验对回归模型进行检验lfit, group(10) table

7191d03172709f52022274d5a3242217.png

**展示回归后的分类结果,包括敏感度和特异度lstat

07fe9340d1cd4e89c052689135ed0496.png

**寻找最佳临界值lsens

1f8b65f3a986679c9b92ad8dd7bacf1b.png

**使用ROC评估回归效果lroc

5b1e2839377c884fc392863584556394.png

5.面板数据logit回归模型
webuse unionxtset idcode yearsum**分析各因素对妇女是否选择参加工会的影响。因为被解释变union为二值选择变量,数据类型又是面板数据,我们考虑使用面板数据的离散选择模型。**固定效应面板数据Logit回归xtlogit union age grade i.not_smsa south##c.year,fe**随机效应面板数据Logit回归xtlogit union age grade i.not_smsa south##c.year,re
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值