r语言调用python_Python调用R语言

网络上经常看到有人问数据分析是学习Python好还是R语言好,还有一些争论Python好还是R好的文章。每次看到这样的文章我都会想到李舰和肖凯的《数据科学中的R语言》,书中一直强调,工具不分好坏,重要的是解决问题的思路,就算是简单的excel,也能应付数据分析中的大部分问题。再者Python和R本来就没有什么好对比的,一门是计算机工程语言,一门是统计语言,只有将两者结合起来,才能发挥更大的威力,不是吗,对于数据分析的人来说,难道不是两样都要掌握的吗?

rpy2是Python调用R程序的模块,旨在方便Python调用R中的相关函数,而不需要先将数据写入txt再传给R来分析,从而可以做到全流程自动化。在pandas 0.18的模块中也添加了rpy2的支持,进而更方便沟通了Python和R的数据流转,构建数据分析的生态系统。

rpy2的安装还是比较麻烦的,试了很多方法,百度了很多网页最终安装成功,做些笔记备忘。

我的安装环境是:

win7_64bit

python3.5_64位,使用的是Anaconda发行版。Anaconda发行版集成了很多Python的有用的数据分析模块,其使用界面和MATLAB很相似,用起来很方便,而且还很方便虚拟出不同版本的Python环境,对那些既想用python2.7,又想用python3.x的同学来说是很好的选择。

R使用的是Revolution R Open 3.2.3_64bit,这是Revolution R现在已经被微软收购了,改为MRO。MRO和CRAN的R没有什么区别,只是改进了多进程并行计算的性能,比原生的R确实有一定的性能提升。当然需要MRO网站上对应的数学计算库Math Library,这个在Revolution R Open的下载界面有。

1.下载并安装MRO

2.下载安装Anaconda

3.配置R的环境变量

这是比较重要的一般,很多安装失败的原因就是没有很好配置环境变量。

1. 将R目录添加至path环境变量

path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64;

2. 将R.dll添加至path环境变量

path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64\R.dll;

3. 设置R_HOME环境变量

R_HOME:D:\Program Files\Microsoft\MRO\R-3.2.3

4. 设置R_USER环境变量

R_USER:Administrator

R_USER就是你电脑的用户名,如果没有设置过用户名就是Administrator,可以通过cmd命令行输入 net user查看。

4.下载非官方版本的rpy2

为什么要下载非官方版本的rpy2我也不知道,反正我使用pip install ryp2没有成功,缺少对应的编译环境,百度出来的网页很多都是说使用非官方版本的rpy2.

下载地址是:pip install rpy2-2.9.4-cp36-cp36m-win_amd64.whl安装即可。

5.python调用R

importrpy2.robjects as robjects#此时,有三种方法调用R对象#第一种

robjects.r['pi']#第二种

robjects.r('pi')#这种方法从某种程度上讲是万能的,因为可以将任意大小和长度的R代码写成一个python字符串,之后通过robjects.r('Rcode')调用执行

第三种

robjects.r.pi#这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法

#creat an R function

robjects.r('''f <- function(r){pi * r}''')

robjects.r['f'](3)#internal function in R

robjects.r['ls']()#another internal function

l = robjects.r['letters']

len(l)

robjects.r['paste'](l, collapse = '-')#an alternative way of getting 'paste' function in R#eval the R code

coder = 'paste(%s, collapse = "-")' %(l.r_repr())

robjects.r(coder)

6.pandas调用R

7.pandas和R的函数对比

具体参考 pandas官方文档–Comparison with R / R libraries

列出了实现相同功能的pandas和R的代码,很有启发性。

同时也说明,有想法,用什么工具实现都无所谓,纠结要选python还是R确实是舍本逐末了。如果时间不够,精通其中的一门语言,另一门语言能够掌握简单的使用,也就够了。

以后有事时间再详细写写pandas调用R的部分,以它们之间数据来回传输的原理和注意事项。

我把下载的包放到了d盘的programdata

1322499-20180822203812115-355762443.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值