1、关于Python和Stata
Python,易学易懂,其自然语言一般的语法行云流水,已经获得无数科学家、工程师的青睐。在2019年的世界编程语言中,Python已超过C++成为全世界第三大编程语言,仅在Java和C的后面。而且,在全球前20名的编程语言中,使用Python的比例的增速也是最快的。可以说,Python是极有前途的语言。
作为一种“胶水语言”,Python可以通过下载各种各样的“包(package)”获得各种奇怪强大的能力,比如强大的数据处理Pandas包、矩阵运算Numpy包、画图的Matplotlib包、机器学习的Scikit-learn包、深度学习的Tensorflow框架,还有用于爬虫的、用于自然语言处理的,等等。
然而,尽管Python也有专门用于计量经济学研究的statsmodel包,其功能却远不及这个领域的“老大”:Stata。作为经管类学生的科研宝剑,Stata凭借其丰富的、前沿的计量经济学支持,以及经得起考验的各类函数和命令,屹立于计量经济学的研究中。
不过,要让习惯于使用Python的科学家和工程师花时间去学习它并不是一件轻松的事情。主要问题在于,虽然Stata在计量上非常强大,但其对数据的爬取、处理等方面却不如Python的各类包来的方便——这是两种编程思想的碰撞。更何况,为了使用Stata,科学家和工程师们需要重新花时间重新学习数据爬取、处理的方法。
Ties de Kok开发出的IPyStata实现了在Python环境下调用Stata,解决了最让习惯于使用Python的科学家和工程师们头疼的问题。通过IPyStata,用户可以在数据处理、数据爬取、自然语言处理、机器学习、画图等其他方面使用Python编程;数据处理好以后,仅通过简单的命令,即可以在Python中调用Stata的命令,从而学习成本大大降低,不得不为是“神器”!
2、环境部署教程
要完整部署IPyStata包,主要有以下操作:
- 下载Anaconda,并部署Jupyter环境;
- 通过cmd/terminal安装IPyStata包;
- 将Stata的位置绑定到IPyStata;
- 在Jupyter中通过魔法命令
%%stata
调用Stata。
本节将详细地将以上的步骤诉诸读者。
2.1 快速了解Jupyter
为了在Python中使用Stata,我们需要用到一种关键的交互式编程工具:Jupyter Notebook或者Jupyter Lab。Jupyter Notebook(即过去的 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。
Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 最主要的用途是,在进行数据清理和转换、数值模拟、统计建模、机器学习等操作时,Jupyter Notebook提供交互式编程:你可以在其中运行独立的代码块(cell),可以实时获得你所写的代码的结果。
Jupyter Lab可以认为是Jupyter Notebook的升级版,它可以实现在一个网页打开多个Notebook(Jupyter Notebook和Jupyter Lab使用的都是 .ipynb
文件, 下文使用“Notebook”代表Jupyter Lab或Jupyter Notebook打开的文件)。通过安装插件,其可以实现比如在窗口浏览Excel、PDF等文件,在窗口浏览目前Notebook的变量等强大的功能。
2.2 通过Aanaconda部署Jupyter
安装Jupyter Notebook或Jupyter Lab的方法多种多样,这里首先推荐通过Anaconda安装。
Anaconda是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。也就是说,安装了Anaconda,就相当不仅安装好了Python,更安装好了一切常用的Python包(Package)。
安装Anaconda十分简单,只需要进入其官网:https://www.anaconda.com
下载对应系统的版本即可。
Windows用户在安装Anaconda的时候,推荐勾选 Add Anaconda to the system PATH 按钮,这样用户就可以通过系统命令提示符cmd中打开Jupyter(macOS/Linux 用户请无视)。
如果用户点选了 Add Anaconda to the system PATH 按钮,那么请Windos用户打开命令提示符cmd,请macOS/Linux用户打开terminal。输入 jupyter notebook
或 jupyter lab
。点击回车运行,即会弹出一个网页,打开对应的Jupyter环境。
如果在安装Anaconda的时候没有点选此按钮,在安装完成后,可以通过Windows的 开始
找到 Anaconda Navigator
。打开该软件并通过点选 JupyterLab
或者 Notebook
打开Jupyter编译环境。