数据分析工具SAS、R、Python三者之间的选择

数据分析工具SAS和R的比较是数据分析界最大的争议,由于Python的简易和实用性近两年也逐渐得到了分析界的重视,现把SAS、R和Python放到一起从数据分析角度来比较这三个工具的应用情况。

首先对三者进行简单的介绍:

(1)SAS:在商业分析领域,它是无可争辩的霸主。SAS提供了丰富的统计功能,友好的GUI界面可以让分析师快速上手,技术支持也做的相当到位。

(2)R:R可以看做SAS的一个“开源版本”,在学术研究上的应用一直很广泛。由于它是开源的,新的模型和算法也更新很快,并且网上有很多说明文档,是个蛮划算的选择。

(3)Python:最早是一个开源脚本语言,近几年使用率大增。如今一些库(如numpy、scipy和matplotlib)和函数的引入,也使得它能支持几乎所有统计分析和统计建模工作。另外也由于Pandas这个库,使得Python在结构化数据的处理上非常给力。

现将从如下个方面来比较这三个工具:

1. 购买成本

2. SAS、R、Python易学性

3. 数据处理能力

4. 图形处理能力

5. 更新速度

6. 工作前景

7. 客服支持和社区资源

8. 其他因素

对于每一个方面,都给出了一个评分(1分最低、10分最高)。

1. 购买成本

SAS是商业软件,对于大部分分析师个人来说,价格有点不美丽!但是SAS在机构或公司中拥有最高的市场份额。而R和Python是免费的,并且可以任意下载。

SAS - 5

R - 10

Python - 10

2. SAS、R、Python易学性

首先,SAS非常容易上手,比如它的PROC SQL命令,对于任何一个学过SQL的人来说都可以立即上手,并且SAS有一个很好的GUI界面,网上有很多学习资源和培训机构。SAS公司也提供了资格认证考试,当然,这又增加了学习者的成本。R的使用要求懂一点编程,但它是一个低阶的编程语言,也因此一个简单的程序需要编写更长的代码。在编程界,Python以简易性闻名,在数据分析界也是如此,对于没有编程基础的同学们还是要下一番苦功的。

SAS - 9

R - 5

Python - 7

3. 数据处理能力

数据处理能力一直是SAS的优势。R的计算都在RAM内存中进行,于是它的计算过程受限于32位机器的RAM内存大小。从对数据分析工作的处理上看,Python是中级规模数据处理的有力工具。这三种软件都有非常好的数据处理能力并且可以并行计算。

SAS - 10

R - 8

Python - 8

4. 图形处理能力

SAS在“功能性”图形处理上表现不错,然而仅仅是对“功能性”而言。如果你想对图进行一些定制化的修改,则需要去了解纷繁难懂的SAS图形包。

与其他2款软件相比,R在图形处理上的表现最好,有非常多的包可以帮你实现。Python的表现居中,你不仅可以使用本地库(matplotlib),还可以调用R使用一些衍生库。

SAS - 7

R - 8

Python - 5

5. 更新速度

这三个工具都提供了基本的、以及最常用的分析函数,你可以应付大部分模型的构建。R和Python由于其开源性,算法可以很快得到更新,R因为一直广泛使用于学术界,因此更新最快。SAS则要再下一个版本中得到更新。

但从另一方面来说,SAS的更新是自有的研发团队完成的,并且得到了很好的测试。而R和Python的更新是“公开贡献”的,出错的可能性要比较大。

SAS - 6

R - 8

Python - 8

6. 工作前景

全球而言,SAS仍然是公司和机构中使用最多的工具,尤其是大型公司。而R/ Python更多是初创公司的选择,或者是一些想要节约成本的公司。最近几年,R和Python在工作中的使用率增长很快.

SAS - 10

R - 6

Python - 5

7. 客服支持和社区资源

R有最大的在线社区,但没有客服支持,因此出现麻烦只能自己想办法解决,当然也会得到别人的很多帮助。

Python丰富的数据交流社区是 Python 的优势之一,它提供了大量的Python 工具包和特性。

SAS有专业的客服团队支持系统,也有60000名的社区成员,所以如果遇到安装或者其他问题,你可以找他们解决。

SAS - 8

R - 7

Python - 7

8. 其他因素

Python不仅在数据分析方面能力强大,在爬虫、web、自动化运维甚至游戏等等很多领域都有广泛的应用。这就使公司使用一种技术完成全部服务成为可能,有利于各个技术组之间的业务融合。

SAS在端到端的部署上(可视化分析、数据仓库等),曾经有巨大的优势,但由于近年一些平台如SAP HANA和Tableau上对R的集成和支持,使得SAS的这一优势有所下降。尽管和SAS的无缝集成相比差距还很远,但道路已经开启。

碧茂课堂精彩课程推荐:

1.Cloudera数据分析课;

2.Spark和Hadoop开发员培训;

3.大数据机器学习之推荐系统;

4.Python数据分析与机器学习实战;

详情请关注我们公众号:碧茂大数据-课程产品-碧茂课堂

现在注册互动得海量学币,大量精品课程免费送!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ShuYunBIGDATA

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值