python的ols_工具&方法 | 6行代码教你用Python做OLS回归(内附CFPS实例)

写在前面的话

阅读本文前需要掌握的基础知识:Python 的基础知识、 numpy 的基础知识、 pandas 的基础知识、基本的计量知识。如果你还不会,那么本文也会介绍一些 python 语法的基础内容,方便大家理解。

随着数据资源的日渐丰富,学者们越来越多的需要接触到大数据的处理,许多学者还是习惯使用 Stata 对数据进行处理,而 Stata 由于其自身的限制,在处理大数据集时要么需要强劲的处理性能(昂贵的硬件成本),要么需要等待较长时间(更加昂贵的时间成本)。Python 和 R 也就日渐进入学者的视野,相对于 R ,Python 的语法更为简单,成为一部分学者的首选。

在数据处理上,numpy 和 pandas 的组合,使得 Python 能够轻松应对千万级别的数据处理。在攻克数据处理这一环后,在数据应用上,除了新潮的机器学习、深度学习的方法,对于现阶段社科学者来说,计量可能才是最现实的。在 Python 中处理的数据如果还需要调回到 Stata 中做计量,那未免太「蹩脚」。今天,数据Seminar 公众号将带大家体验 Python 上的第三方计量库:Statsmodels[1] 。

简介

Statsmodels 是一个Python的第三方模块,他封装了许多计量模型,方便学者直接调用。所谓封装,就相当于 Stata 中一个 reg 命令,代表了最基础的 OLS 回归命令,在Statsmodels 中也有类似 reg 的语句,提供给 OLS 估计。另外 Statsmodels 的开源协议为 BSD [2](基本上对于用户来说属于为所欲为协议,你可以任意使用这款扩张包,具体参见链接地址)。statsmodels is a Python module that provides classes and functions for the estimation of many different statistical models, as well as for conducting statistical tests, and statistical data exploration. An extensive list of result statistics are available for each estimator. The results are tested against existing statistical packages to ensure that they are correct. The package is released under the open source Modified BSD (3-clause) license. The online documentation is hosted at statsmodels.org.

安装

如果你使用 Anaconda 安装的 python ,那么:conda install statsmodels

如果你使用 pip 管理你的python

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值