0 前言
本文详细介绍如何在Python中拟合Logit模型,包括数据准备、哑变量的处理、参数拟合结果解读等内容。
关注【DCM笔记】,查看更多关于离散选择模型的文章:
在【DCM笔记】系列文章的第5篇中,我们用SAS软件去拟合Logit模型(更多介绍请参照:Logit模型拟合实战案例(SAS)——离散选择模型之五);本篇将介绍如何利用Python去拟合同样的模型,并对结果进行解读。
案例介绍
这里仍然使用和上一篇中相同的数据。我们要研究的问题是:在申请的研究生的时候,什么样的学生更容易被录取。
原始数据保存在名为“Application.csv”的文件中(文件格式为csv格式),每一行代表一条申请者的记录:
原始数据中包含3个自变量:
- 申请者的GRE成绩,用变量 gre 表示;
- 申请者的平均绩点,用变量 gpa 表示;
- 申请者所在的本科院校的排名,用变量 rank 表示。
变量gre和gpa都是连续变量。rank为离散变量,只能取1、2、3、4中的某一个值;rank=1对应的学校排名最高,而rank=4对应的排名最低。
申请的结果只有两种情形:“录取”或者“拒绝”。我们用变量admit表示申请结果,显然,admit是一个二分类的变量——adm