rstudio深度学习_为什么现在是时候学习R

rstudio深度学习

我们都听说过大数据; 在过去的几年中,许多公司投资了Hadoop,NoSQL和数据仓库,以收集和存储大量新数据。 即使是基于像Hadoop这样的开源平台,对于拥有新硬件,新员工以及花费大量时间实施新系统和程序的大公司来说,这些投资也可以轻松地数百万美元。

现在是该投资获得回报的时候了。

做到这一点的方法是使用数据科学 ,即从数据中提取知识。 不仅仅是将数据制表和报告; 数据科学结合了计算机科学,统计分析和对业务需求的敏锐理解,可以将因果关系与相关性分开,并预测未来的结果和风险。 根据TheNextWeb的说法 ,数据科学家正在“改变商业智能的面貌。”而且,数据可用性的提高使数据科学对于产品开发,创建和管理对于自动化系统而言过于复杂的创新至关重要,尤其是在当今世界隐私问题至关重要。

结果,公司正大量雇用数据科学家。 根据工作追踪程序Indeed.com的数据,自2011年初以来,数据科学家的工作岗位激增。 尽管近几个月来,随着数据科学家担任专门的职务,数据科学技能普遍获得了很大的增长。 同时,数据科学家的薪水仍然令人印象深刻:根据O'Reilly Media最新的数据科学薪资调查,全球的中位数为98,000美元,在美国为144,000美元。

Job Trends

如此强劲的需求和如此高的薪水,招聘数据科学家的竞争如此激烈也就不足为奇了。 结果,以前依靠传统专有平台进行统计分析的公司现在正在采用新的替代方案,即开源R。 到目前为止,全球已有超过200万的数据科学家和统计人员选择了该方法。

R是用于统计数据分析的开源软件平台。 R项目始于1993年,当时由新西兰的两位统计学家Ross Ihaka和Robert Gentleman进行,目的是创建一个新的统计计算研究平台。 从那时起,该项目的领导者已经成长为包括来自世界各地的20多位领先的统计学家和计算机科学家。

很大程度上是由于R的开源特性,R被可扩展性作为学术研究平台而吸引了世界各地大学的统计部门。 节省成本当然也起到了作用。 不久之后,统计学,数据科学和机器学习的研究人员就开始在学术期刊上发表论文,并实施R代码以实现其新方法。 R使这个过程非常容易:任何人都可以将R程序包发布到CRAN(“综合R存档网络”),并提供给所有人。 在撰写本文时,成千上万的R用户向CRAN贡献了6,100多个软件包,从而扩展了R在诸如计量经济学临床试验分析社会科学基于Web的数据等领域的功能 。 并且可以轻松地在MRAN上按主题或关键字搜索R应用程序。

尽管核心R项目由R基金会 (位于奥地利维也纳的非营利组织)维护,但其他公司和组织也正在扩展R。 BioConductor项目创建了另外900多个软件包,使R成为用于基因组和遗传数据分析的领先软件。 RStudio为R语言创建了一个出色的开源交互式开发环境,从而进一步提高了R用户的生产力。 Revolution Analytics通过Revolution R Open提高了R的性能,并使其易于通过DeployR将R嵌入到其他应用程序中。

随着R在学术领域的广泛使用,不久之后它也开始在商业领域得到使用。 2009年1月,《纽约时报》技术部分的头版文章引起了很多新的兴趣,Revolution Analytics一直非常活跃,提供技术支持,服务和大数据功能。 如今,R被IEEE Spectrum排名为第9大最受欢迎的语言,并且一直被列为数据科学最受欢迎的语言成千上万的公司正在将R应用于数据科学应用。

这里只是几个例子:

  • Google使用R来计算广告系列的投资回报率。
  • 福特使用R改进其车辆的设计。
  • Twitter使用R监视用户体验。
  • 美国国家气象局使用R来预测严重洪灾。
  • 洛克菲勒政府学院使用R来开发模型来模拟公共养老基金的财务状况。
  • 人权数据分析小组使用R来量化战争的影响。
  • 纽约时报经常使用R来创建信息图表和交互式数据新闻应用程序。

这些公司之所以采用R,是因为它是数据科学家更喜欢使用的平台。 而且,至关重要的是,考虑到数据科学家的资源有限,它也是使数据科学家生产力最高的平台。 与仅提供受约束的点击工具或黑匣子程序的专有系统不同,R是一种成熟的编程语言。 基本语言包括典型数据科学应用程序所需的所有功能:用于数据访问和准备,数据可视化,统计建模和预测的功能。 完整的数据分析通常仅用几行代码即可表示。 而且,由于使用R的数据科学家不仅可以生成报告,还可以生成代码,因此他们可以更轻松地进行协作,复制结果(尤其是在自动化生产环境中),并可以重用其他项目中的代码以更快地完成任务。

R的开放源代码性质在创新方面也为公司提供了推动力。 在当今以数据为中心的世界中,这是极其重要的,在这个世界中,即使比预测竞争对手更好地预测客户需求或财务回报的微小优势也可能意味着成功与失败之间的差异。 由于统计和机器学习中最前沿的研究都是在R中完成的,因此通常最先将最新技术作为R的软件包使用,需要数年甚至数十年的时间才能出现在R上,直到出现在专有系统中。

因此, 根据Gartner的研究 ,将数据科学作为头等大事,R的普及程度将进一步提高。 而且,如果您想扩大自己的职业潜力,并且拥有数据分析技能,那么与了解R语言相比,您可能会做得多。

开源的
招贤纳士

有关开源工作和职业的文章的集合

翻译自: https://opensource.com/business/14/12/r-open-source-language-data-science

rstudio深度学习

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值