【新手上路常见问答】R和Python在数据科学的应用比较

目录

1. 什么时候和如何使用R?

2. 什么时候和如何使用Python?

3. R的优点

4. R的优点亦或是不足

5. R的不足

6. Python的优点

7.Python的优点亦或是缺点:可视化

8.Python的缺点


图片来源:https://www.datacamp.com/tutorial/r-or-python-for-data-analysis

为帮助开发者小伙伴快速学习快速提高,我开辟了《新手上路常见问答》栏目,将大家的问题汇集起来,希望能给大家一些快速导引,避免给自己挖坑,少走弯路。

关于R和Python在数据科学的应用,今天我们来做一下比较。

1. 什么时候和如何使用R?

如果数据分析任务需要对各个服务器进行独立计算或分析,建议使用R。它非常适合研究和探索性工作,几乎可以用于任何类型的数据分析,因为大量的软件包和易于使用的测试通常可以提供快速启动和运行所需的工具。 R也能在大数据解决方案中应用。

R提供了以下热门软件包:

dplyr,plyr和data.table用来轻松操作包,

stringr处理字符串,

zoo用于正常和不规律的时间序列,

ggvis,lattice和ggplot2可视化数据,

caret用于机器学习

2. 什么时候和如何使用Python?

当数据分析任务需要与Web应用程序集成或者统计代码需要合并到生产数据库中时,可以使用Python。作为一个完全成熟的编程语言,它是实现生产使用算法的好工具。

利用NumPy / SciPy(科学计算)和pandas(数据处理)包,Python可用于数据分析,matplotlib可以用来画图,scikit-learn是机器学习的应用包。

3. R的优点

  • R有很好的可视化工具包

可视化数据通常比原始数字更有效,也更易被理解。可视化软件包ggplot2,ggvis,googleVis和rCharts都有很好的功能。

  • R有较好的生态系统

R拥有丰富的很前沿的包生态系统和活跃的社区。可在CRAN,BioConductor和Github下载R包,可以通过Rdocumentation搜索所有R包。

  • R是数据科学的通用语言

R由统计学家开发。他们可以通过R代码和软件包来交流想法和概念,不一定需要计算机科学背景才能开始。此外,R在学术界之外越来越多地被采用。

4. R的优点亦或是不足

R的出现,帮助了统计学家,但是增加了计算机的运行时间。虽然由于编写代码不足,R的运行速度很慢,但是有很多包可以提高R的性能,如pqR,renjin和fastR,Riposte等等。

5. R的不足

R学习起来不是很容易,特别地,如果从GUI进行统计分析会非常困难。如果对R不熟悉,即使查找包也可能很耗时。

6. Python的优点

  • 可以使用IPython笔记本轻松使用Python和数据。

可以轻松地与同事共享笔记本,而无需安装任何程序,可以大大减少组织代码、输出和笔记文件的开销,可以提高工作效率。

  • Python是一种简单直观的通用语言

Python是一种简单直观的通用语言。学习起来很容易,也提高了开发程序的效率。大家可以查看我的文章【新手上路常见问答】关于Python

此外,Python测试框架是一个内置易使用的入门测试框架,可以进行良好的测试覆盖,代码的重用性和可靠性能得到保障。

7.Python的优点亦或是缺点:可视化

Python有一些很好的可视化库,例如Seaborn,Bokeh和Pygal。此外,与R相比,Python的可视化通常更复杂,展示结果也并不理想。

8.Python的缺点

Python是R的挑战者。它不提供数百种必需R包的替代方法。

做数据分析时,究竟用R还是Python呢,根据以上的比较,大家应该会有一些判断了吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值