python中调用R

需要在python中调用R,实在是一种无奈的选择。如果能在一门语言中独立完成课题,是一个比较理想的做法。但是,这种想法也不太现实,毕竟每一种语言都有自己的长处。如果能取长补短,综合使用各种语言,也能起到不错的效果。

现在遇到的问题是,如何在python中调用R?这其中包括了如何调用R的对象(函数和包),R和python的对象如何互相转换,以及如何调用R的脚本(外界参数的输入)。python提供了一个模块rpy2,可以较好地完成这项工作。

1. 安装rpy2
可以使用easy_install安装,#  easy_install rpy2

注意事项
1. 如果是源代码编译安装R,需要在configure步骤加入后缀 --enable-R-shlib
2. 需要安装python-devel包

2. python调用R对象
2.1 使用 rpy2.robjects包的 r对象
调用方法如下,以下robject.r的调用方法实际上是开启了一个R的交互进程,只需要将R的代码写入一个字符串内( 注1),接着调用R即可:
==========================
import rpy2.robjects as robjects
==========================
此时,有三种方法调用R对象:
第一种: robjects.r['pi']
第二种: robjects.r('pi')(这种方法从某种程度上讲是万能的,因为 可以将任意大小和长度的R代码写成一个python字符串,之后通过 robjects.r(' Rcode ')调用执行。)
第三种: robjects.r.pi(这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法)
以下是一个创建和使用R函数(自己创建的函数或者R内置函数)。 注意:最后一种方法,对于对付一些特殊的格式很管用:
==========================
# creat an R function
>>>  robjects.r(
           '''
           f <- function(r){pi * r}
   .       '''
           )
>>>  robjects.r['f'](3)
[9.424778]
# internal function in R
>>>  robjects.r['ls']()
# another internal function
>>>  l = robjects.r['letters']
>>>  len(l)
>>>  robjects.r['paste'](l, collapse = '-')
# an alternative way of getting 'paste' function in R
# eval the R code
>>>  coder = 'paste(%s, collapse = "-")' % (l.r_repr())
>>>  robjects.r(coder)
==========================

对于一些特殊的R对象比如list和matrix,如果python要调去其中的部分数据,可以通过 rx() rx2() 方法操作。对于list, 可以查看其name属性,以获得列表个个元素名称。 rx() 和相当于"["操作(注意取出的是R的list对象),而rx2()相当于"[["操作。一个例子:
===========================================
>>>  tmp = r("list(a = matrix(1:10, nrow = 2), b = 'Hello')")
>>>  print tmp
$a
        [,1] [,2] [,3] [,4] [,5]
[1,]      1      3      5      7      9
[2,]      2      4      6      8    10

$b
[1] "Hello"
>>>  tmp.names
<StrVector - Python:0x8afdc8c / R:0x8ce0a70>
['a', 'b']
>>>  tmp.rx('a')
<ListVector - Python:0x8afd86c / R:0x8cf71c0>
[Matrix]
   a: <class 'rpy2.robjects.vectors.Matrix'>
   <Matrix - Python:0x8b013cc / R:0x97de388>
[          1,            2,            3, ...,            8,            9,          10]
>>>  tmp.rx(1)
<ListVector - Python:0x8b010cc / R:0x8cf7100>
[Matrix]
   a: <class 'rpy2.robjects.vectors.Matrix'>
   <Matrix - Python:0x8b017cc / R:0x97de388>
[          1,            2,            3, ...,            8,            9,          10]
>>>  tmp.rx2(1)
<Matrix - Python:0x8b01b4c / R:0x97de388>
[          1,            2,            3, ...,            8,            9,          10]
>>>  tmp.rx2('a').rx(1, 1)  # first element of 'a'
<IntVector - Python:0x8b01acc / R:0x8cf6fa0>
[          1]
>>>  tmp.rx2('a').rx(1, True)  # first row of 'a'
<IntVector - Python:0x8b01f2c / R:0x965ffd8>
[          1,            3,            5,            7,            9]
========================================



注意事项:
1. 如果函数有警告(warnings),在ipython等IDE上能够执行,但是如果是脚本或者与网页服务器交互,则会产生错误。解决办法:1. 鲁莽的解决很简单,强行忽略R的警告,options(warn = -1)或者R代码放入函数中 suppressWarnings()。2. 第二种办法,如果是自己代码中使用了 warning()函数,则将warning信息换成字符串,之后单独输出。
2. 如果R的函数参数用到向量,有两种解决办法:1. 使用 robject.**Vector()函数(见下)先将python对象转换成R对象,然后带入函数;2. 直接使用python对象,一个例子:
=======================================
>>>  from rpy2.robjects import r
>>>  a = r['matrix'](range(10), nrow = 2)
>>>  print a
        [,1] [,2] [,3] [,4] [,5]
[1,] 0      2      4      6      8    
[2,] 1      3      5      7      9    

========================================

2.2 python对象转换成R对象
通常,可以将python的list对象,转换成为R的vector对象,之后直接使用R函数调用。相应的函数是 robjects.StrVector()/ robjects.IntVector()/ robjects.FloatVector()/ robjects.complexVector()/ robjects.FactorVector() / robjects.BoolVector() /,这些函数将python列表转化成R的字符/整数/浮点/复数/因子/布尔向量。 robjects.ListVector()将python的字典转换成R的列表。
比如:
==================================================
>>>  testmatrix = robjects.IntVector([1, 2, 3, 4])
>>>  robjects.r['matrix'](testmatrix, nrow = 2)
# another dynamic arguments example
>>>  x = robjects.IntVector(range(10))
>>>  y = robjects.r.rnorm(10)
>>>  kwargs = {'ylab': 'foo/bar', 'type': 'b', 'col': 'blue', 'log': 'x'}
>>>  robjects.r.plot(*args, **kwargs)
>>> 
===================================================
注意事项:
1. 使用vector系列函数时,输入的只能是python的列表,而不能是数字或者字符串。

2.3 载入和使用R包
使用rpy2.robjects.packages.importr对象,调用方法是
===================================
>>>  from rpy2.robjects.packages import importr

>>>  base = importr('base')
>>>  stats = importr('stats')
>>>  affy = importr('affy')
>>>  stats.rnorm(10)
===================================
如果想引用一个包中的隐变量,也很简单,只要载入包,然后所有r命令化成成字符串,之后引用即可(这种方法是万能的),比如
=======================================================================
>>>  from rpy2.robjects.packages import importr
>>>  importr('hwriter')
>>>  a = r('hwriter:::hwrite.table(matrix(1:10, 2))')
>>>  print(a)
[1] "<table border="1">n<tr>n<td>1</td><td>3</td><td>5</td><td>7</td><td>9</td></tr>n<tr>n<td>2</td><td>4</td><td>6</td><td>8</td><td>10</td></tr>n</table>n"
=========================================================================

2.4 导入R脚本
使用R的source函数:
========================
from rpy2.robjects import r

r.source('testrscript.r')
=======================

2.5 转换R对象为全局变量
因为使用函数 robjects.globalenv() 将对象转换成全局变量,特别是遇到python找不到一个R对象时(此时R对象可能通过r('Rcode')调用),留意将R对象转变成全局变量。

3. R对象转换成python对象
推荐使用tuple( )或者list( )函数,将R对象转换成tuple或者list。
==========================================
>>>  a = r('c(1, 2, 3)')
>>>  a
<FloatVector - Python:0x904746c / R:0x9114978>
[1.000000, 2.000000, 3.000000]
>>>  str(a)
'[1] 1 2 3n'
>>>  tuple(a)
(1.0, 2.0, 3.0)
>>>  list(a)
[1.0, 2.0, 3.0]
>>>  b = r('matrix(1:6, 2, 3)')
>>>  b
<Matrix - Python:0x9039c6c / R:0x9114710>
[          1,            2,            3,            4,            5,            6]
>>>  print b
        [,1] [,2] [,3]
[1,]      1      3      5
[2,]      2      4      6
>>>  tuple(b)
(1, 2, 3, 4, 5, 6)
>>>  list(b)
[1, 2, 3, 4, 5, 6]
==========================================


参考文献和注释:
注释1:对于R代码,即便是将一段R代码写成一行(尽管看起来很丑陋而且不推荐),一样可以执行。但是,反过来,对于python代码则没有这么简单。因为,python代码是靠缩进来划分代码的区域,假若一段代码中有两个循环嵌套,如果此时将所有代码写成一行,执行起来就要麻烦的多(很可能要依赖空格的多少进行解释)
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值