python读取sas数据集_SASpy模块,利用Python操作SAS

SASpy模块打通了Python与SAS之间的连接。有了SASpy模块,我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法,最后通过一个聚类分析的例子,来展示如何在Python中调用SAS的机器学习过程,以及对聚类结果的可视化。

SASpy模块特点

1、需要Python3.X及以上,SAS9.4及以上,需要Java环境;

2、无论是本地SAS还是远程服务器上的SAS,都可以使用SASpy调用SAS进程;

3、可以在Python和SAS之间传递数据(也就是Pandas数据框与SAS数据集可以相互转换);

4、某些Pandas方法可以直接在SAS数据集上使用(实际背后进行了转化);

5、可以调用SAS的各种模块,比如统计stat、质量控制qc、预测ets、机器学习(EM模块)等。

SASpy模块的安装

关于安装的介绍,请参考如下文章:

1、SAS中文论坛,https://www.sohu.com/a/218339423_278472

2、SASpy的官网,https://sassoftware.github.io/saspy/install.html

上篇:SASpy模块的基本方法

假使我们已经安装好了SASpy模块,现在我们只需要导入该模块,并通过saspy.SASsession()来建立一个SAS进程(可能会花费数十秒),当看到提示:SAS Connection established时,这说明我们已经成功创建。如果有任何报错,可以参考如上两篇安装文章中的提示。直接输入sas,可以看到有关该进程的一些接口、基本参数信息。此外&#x

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据分析,数据科学及AI算法是当前最热门的职业。这些职业有着共同的特点:面向数字的,针对编程的以及采取分析手段的。 这些当代热点特性使得在就业市场上对以上职位需求激增也就不足为奇了。但是,市场上提供这方面的大型综合的培训课程是有限,如果说有,大多是知识范围狭窄且非综合性的,而且大多培训都缺乏方法论与实务结合。一般的情况是讲师讲述某种语言的一堆代码,学生听完后甚至连使用方法及代码的前提都不清楚,更别提实际应用场景了。这里,掌握一门数据分析软件本身没错,但仅通过单一的编程培训很难获得聘用为数据分析师或数据科学家所需的技能。那我的解决方案是什么呢?首先,我把所有数据分析中的典型问题都归类总结出来,再结合相应的实际问题,数据以及案例,同时采用世界上最流行的两种数据分析软件:PYTHONSAS去解决这些问题,并将这些解决方法传授给学生。学生在完成培训后更重要的收获是知道每一问题从产生直至解决的前因后果和应用场景,这是因为我在每一课程章节最前都会交代方法论,知识要点及应用场合。SASPYTHON可以一起学吗?当然可以。因为我就是这样做到的。具体步骤是,我在课程当中安排了一系列主题,然后使用两种编程语言解决同样的问题。我总结出这样做的好处是边学习边比较,最后在不知不觉当中掌握了两门语言的精华和数据分析的通用方法或模式。过程虽有点长,但十分有趣。最后,为了巩固已学的知识和技能,我还专门安排了针对PYTHONSAS的中小型项目及详细代码讲解。另外,课程当中使用的全部编程代码及数据文件都将免费地提供给注册的学生。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值