SASpy模块打通了Python与SAS之间的连接。有了SASpy模块,我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法,最后通过一个聚类分析的例子,来展示如何在Python中调用SAS的机器学习过程,以及对聚类结果的可视化。
SASpy模块特点
1、需要Python3.X及以上,SAS9.4及以上,需要Java环境;
2、无论是本地SAS还是远程服务器上的SAS,都可以使用SASpy调用SAS进程;
3、可以在Python和SAS之间传递数据(也就是Pandas数据框与SAS数据集可以相互转换);
4、某些Pandas方法可以直接在SAS数据集上使用(实际背后进行了转化);
5、可以调用SAS的各种模块,比如统计stat、质量控制qc、预测ets、机器学习(EM模块)等。
SASpy模块的安装
关于安装的介绍,请参考如下文章:
1、SAS中文论坛,https://www.sohu.com/a/218339423_278472
2、SASpy的官网,https://sassoftware.github.io/saspy/install.html
上篇:SASpy模块的基本方法
假使我们已经安装好了SASpy模块,现在我们只需要导入该模块,并通过saspy.SASsession()来建立一个SAS进程(可能会花费数十秒),当看到提示:SAS Connection established时,这说明我们已经成功创建。如果有任何报错,可以参考如上两篇安装文章中的提示。直接输入sas,可以看到有关该进程的一些接口、基本参数信息。此外&#x