Python正在取代R 成为数据科学界新宠

转载 2013年12月03日 09:50:07

摘要:R是数据科学家历来选择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。

R:不是真正的语言

Python正在取代R 成为数据科学界新宠 0人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言的交互环境会更有帮助。”

但正如Bob Muenchen强调的,R甚至对于那些精通SAS和SPSS数据统计工具的人来说都是困难的。关于R为分析师降低了复杂性的问题,还有待争议,虽然R包含宏和矩阵语言,此外,你还需要掌握像SPSS等工具。但是对于那些期待R去实现类似Stata的功能的人,他们注定要失望。

综合考虑,R的与众不同使它较难学习。    

Python降低数据科学技术壁垒

Python正在取代R 成为数据科学界新宠 1然而,Python更加平易近人。一方面,各种各样的开发人员都熟悉Python并在广泛的应用领域使用它。不像R几乎只用于数据分析,一个开发人员在第一次编写他的网站脚本或其他应用程序时,就可以体验到Python。

随着企业竭尽所能地使用数据,他们也正在努力寻找合格的数据科学家。然而,正如Gartner的Svetlana Sicular所假设的,在本公司内对员工培训一些简单的大数据技术,比培训新雇佣的数据科学家复杂的商业知识更有效率。

Python 所向披靡

但是,除了可以利用现成的Python开发者资源,用Python语言做数据科学的最大好处之一是:在不同的应用程序中使用一种编程语言所增加的效率。德克萨斯大学奥斯汀分校研究助理Tal Yarkoni解释说:“事实证明,使用一种语言来做所有的开发和分析的好处是相当可观的。一方面,当你可以用同一种语言做所有的事情的时候,你就不必一直提醒自己:Ruby使用blocks而不是comprehensions,在Python中得到数组的大小应当调用len(array),而不是array.length……

另外,你不需要再担心项目的不同模块采用不同语言的接口问题。没有什么比在Python中解析一些文本数据,然后将它转换成内部使用所需要的格式,最后才发现必须将它以另一种格式写到磁盘上,以便R或者MATLAB去做分析更烦人的了。只要使用单一的语言,所有这些开销都将消失。”

我们可以夸赞某个技术完美地解决了一个问题,但往往胜出的技术是解决一系列问题的通用工具。正如AppNexus优化和分析主管David Himrod指出:“AppNexus面临的最大挑战之一是如何让不同的员工使用相同的技术来工作。Python为具有不同背景的员工(尤其是工程师,数学家和分析师)提供了一种常见的、容易理解的语言,可用于公司将新功能进行标准化。”

使用Python的主流数据科学

相比R丰富的数据分析能力,Python尚有很多不足,但是它正在迅速的缩小差距。请记住:Python成功的关键并不是它比R或其他分析工具能够处理更神秘的功能,而在于它的平易近人和通用的性质。数据科学正在走出头号怪胎的领域,上个月在纽约举行的O'Reilly's Strata会议这一点尤为明显:过去的与会者多是学术领域的博士,现在则是关键的业务分析师和其他被企业要求去弄清楚大数据业务的人。

相比R,这种新的,早期的“数据科学家”,将更多地使用Python。Python使用起来相对简单,而且他们可能已经将其用于一个项目中了。至于在其他市场,相比于那些功能强大但复杂的工具,熟悉或者容易学习的工具更容易取胜。

转自:http://news.cecb2b.com/info/20131203/1598497.shtml

Python正在取代R,成为数据科学界新宠(转)

R:不是真正的语言 人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言...
  • u014032673
  • u014032673
  • 2014年06月26日 11:38
  • 384

Python正在取代R,成为数据科学界新宠

择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。 R:不是真正的语言 人们学习R很困难的一部分原因是,它并不是...
  • zkn_CS_DN_2013
  • zkn_CS_DN_2013
  • 2013年12月03日 16:52
  • 616

重大改变!Python或将取代VBA,成为Excel官方脚本语言!

据外媒报道,微软正考虑添加 Python 为官方的一种 Excel 脚本语言,如果获得批准,Excel 用户将能够像目前使用 VBA 脚本一样,使用 Python 脚本与 Excel 文档、数据以及一...
  • DP29syM41zyGndVF
  • DP29syM41zyGndVF
  • 2017年12月19日 00:00
  • 422

数据科学界华山论剑:R与Python巅峰对决

摘要: 如果你是数据分析领域的新兵,那么你一定很难抉择——在进行数据分析时,到底应该使用哪个语言,R还是Python?在网络上,也经常出现诸如“我想学习机器语言,我应该用哪个编程语言”或者“我想快速解...
  • pinellina
  • pinellina
  • 2016年03月02日 17:17
  • 940

数据科学中R VS Python:获胜者是...

数据科学中R VS Python:获胜者是…在”最佳”数据科学工具的比赛中,R和Python都有自己的优缺点.对二者的选择取决于使用背景,学习花费和其他常用工具的需要 Martijn Theuwiss...
  • Er8cJiang
  • Er8cJiang
  • 2016年04月05日 16:41
  • 2003

R or Python,为了处理数据到底该学哪个?

本文从个人的经历出发,谈谈对R和Python的认识,因本人刚刚毕业小学僧一枚工作资历尚浅,且R和Python基本上都是自学的只能算马马虎虎入门级别,所以文中所述仅仅小蛙井底之言。      小僧最早接...
  • sweeper_freedoman
  • sweeper_freedoman
  • 2016年04月04日 19:24
  • 2389

数据挖掘编程语言选择(Python与R的PK)

数据挖掘技术日趋成熟和复杂,随着互联网发展以及大批海量数据的到来,之前传统的依靠spss、SAS等可视化工具实现数据挖掘建模已经越来越不能满足日常需求,依据美国对数据科学家(data scientis...
  • goodhuajun
  • goodhuajun
  • 2014年09月25日 17:54
  • 2764

【R语言或PYTHON语言入门必读】大数据分析师到底需要懂什么(二)

在统计分析和数据挖掘,我们经常用的算法有二元分类器、数值预测器、回归、贝叶斯网络、Logistics回归、判别式、两步、序列、时间序列、QUEST、C&R树、CHAID、GRI、Apriori、异常、...
  • BETTINA26
  • BETTINA26
  • 2016年09月20日 20:03
  • 1536

关于《Python绝技:运用Python成为顶级黑客》的学习笔记

这里将会把《Python绝技:运用Python成为顶级黑客》中的代码敲一遍,然后根据具体的情况修改一下代码,时间足够的话就会继续敲代码更新一下,期间肯定会有很多问题需要懂得的大牛指导一下~ 为了...
  • u014538198
  • u014538198
  • 2017年06月22日 14:16
  • 2777

七周成为数据分析师—Excel函数篇

原文链接 摘要: 本文是《七周成为数据分析师》的第一篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。 世界上的数据...
  • aikudemn
  • aikudemn
  • 2017年07月06日 10:59
  • 388
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Python正在取代R 成为数据科学界新宠
举报原因:
原因补充:

(最多只允许输入30个字)