前言:本文详细介绍如何利用 Biogeme 拟合二项 Logit 模型,包括数据准备、分类变量的处理、Biogeme 中效用函数 的设定等内容。
在【DCM 笔记】系列文章中,我们已经尝试过用 SAS 和 Python 的 statsmodels 包去拟合二项 Logit 模型;相关案例:
•Logit 模型拟合实战案例(SAS)——离散选择模型之五
•Logit 模型拟合实战案例(Python)——离散选择模型之六
相比较之下,Biogeme 在指定效用函数方面更加灵活——Biogeme 中可以非常方便地为每一个变量在不同的方案中指定不同的系数(即 Alternative Specific Coefficients);此外,作为基于 Python 的开源软件包,Biogeme 的免费特性也吸引着很多的用户。
本篇将使用和上面两篇文章相同的数据,重点介绍如何使用 Biogeme 拟合二项 Logit 模型;并将结果和 SAS 对比。
Biogeme 相关资料:
•Biogeme 入门教程(中文版):链接
•Biogeme 安装教程:链接
文末提供数据和代码的下载链接。
案例介绍
本例我们要研究的问题是:在申请的研究生的时候,什么样的学生更容易被录取。
原始数据保存在名为“Application.csv”的文件中(文件格式为.csv 格式),每一行代表一条申请者的记录;示例数据如下图所示: