使用Rserve远程执行R脚本


Rserve介绍

        Rserve是一个基于TCP/IP协议的,允许R语言与其他语言通信的C/S结构的程序,支持C/C++,Java,PHP,Python,Ruby,Nodejs等。 Rserve提供远程连接,认证,文件传输等功能。我们可以设计R做为后台服务,处理统计建模,数据分析,绘图等的任务。

        详细介绍请参照官方网站:https://rforge.net/Rserve/


Rserve安装

Linux系统下建议使用root权限安装。下面的内容是依据Windows7系统中安装过程进行描述的。

进入R语言解释器:R

安装命令:install.packages("Rserve")

然后安装程序会提示我们选择下载镜像,提示如下:

--- Please select a CRAN mirror for use in this session ---

等我们选择了镜像后(测试时选择的是China(xxx)),安装程序便进行下载安装,最终会输出如下的信息(Linux下的输出信息或有不同):

说明Rserve安装成功,安装路径为:%R_HOME%libraryRserve目录。


启动Rserve服务

在Windows命令窗口进入R_HOMElibraryRservelibsi386目录中执行如下命令(我的Windows7是32位的,如果是64位系统对应目录为R_HOMElibraryRservelibsx64):

  1. R CMD Rserve  
复制代码


R将作出如下应答:

说明Rserve启动成功(端口6311),可以进行连接测试了。

上面的启动命令使用的本地模式,如果想远程连接需要增加参数 –RS-enable-remote

即启动命令为:

  1. R CMD Rserve --RS-enable-remote  
复制代码


Java远程连接Rserve

下载依赖jar包,地址:http://www.rforge.net/Rserve/files/
共两个jar包,下载完成后将它们加入到项目的classpath中即可:

  •  REngine.jar
  •  RserveEngine.jar

也可以到Rserve安装目录中寻找,比如:R_HOME libraryRservejava目录中就有相关jar包,名字略有不同,经测试可以使用:

简单的测试代码:

  1. package com.zyh.up.general.rjava;  
  2.   
  3. import org.rosuda.REngine.REXPMismatchException;  
  4. import org.rosuda.REngine.Rserve.RConnection;  
  5. import org.rosuda.REngine.Rserve.RserveException;  
  6.   
  7. public class RserveBegin {  
  8.     public static void main(String[] args) {  
  9.         try {  
  10.             callRserve();  
  11.         } catch (RserveException e) {  
  12.             e.printStackTrace();  
  13.         } catch (REXPMismatchException e) {  
  14.             e.printStackTrace();  
  15.         }  
  16.     }  
  17.       
  18.     static void callRserve() throws RserveException, REXPMismatchException {  
  19.         RConnection rConnection = new RConnection("192.168.101.122");  
  20.           
  21.         String rv = rConnection.eval("R.version.string").asString();  
  22.         System.out.println(rv);  
  23.           
  24.         double [] arr = rConnection.eval("rnorm(10)").asDoubles();  
  25.         for(double d : arr) {  
  26.             System.out.println(d);  
  27.         }  
  28.     }  
  29. }  
复制代码


测试可以通过,程序将输出R语言版本信息及10个Double类型的数字。

Java远程执行R脚本

上面的示例只是执行R命令,但如果我们在服务器上放置R脚本又该如何执行该脚本或调用其中的函数呢?

有两种方法可以完成上面的问题。

假如我们定义了一个R脚本area.R,其中定义了一个方法area,该方法接收一个半径值然后计算对应面积并返回,脚本内容非常简单:

  1. area<-function(r){pi*r^2}  
复制代码

下面描述一下如何调用这个脚本中的area函数,并获取其返回值。

第一种方法就是直接用source函数将area.R脚本加载上来,然后就可以像调用R语言内置命令/函数一样调用脚本中的area方法了。这样做有一个缺点就是每建立一次Java与R之间的连接就需要调用source函数一次。
示例代码:

  1. package com.zyh.up.general.rjava;  
  2.   
  3. import org.rosuda.REngine.REXP;  
  4. import org.rosuda.REngine.REXPMismatchException;  
  5. import org.rosuda.REngine.Rserve.RConnection;  
  6. import org.rosuda.REngine.Rserve.RserveException;  
  7.   
  8. public class RserveBegin {  
  9.     public static void main(String[] args) {  
  10.         try {  
  11.             callRScript();  
  12.         } catch (Exception e) {  
  13.             e.printStackTrace();  
  14.         }  
  15.     }  
  16.       
  17.     static void callRScript() throws RserveException, REXPMismatchException {  
  18.         RConnection rc = new RConnection("192.168.101.122");  
  19.         // source函数需要给出R脚本路径, 注意传入转义的引号  
  20.         rc.eval("source("/home/Hadoop/wangfeng/javaR/area.R")");  
  21.           
  22.         REXP rexp = rc.eval("area(10)");  
  23.         System.out.println("Area of 10 is " + rexp.asDouble());  
  24.     }  
  25. }  
复制代码

代码测试通过。

另一种调用R脚本的方法是通过Rserv.conf配置文件,该文件路径为/etc/Rserv.conf,如果文件不存在则创建一个新的,然后在文件中添加如下的代码:

  1. source /home/hadoop/wangfeng/javaR/area.R  
复制代码

然后重新启动Rserve服务即可。

使用这种方式Java测试代码需要去掉source语句这一行,即:

  1. rc.eval("source("/home/hadoop/wangfeng/javaR/area.R")");  
复制代码

其它不变,经测试成功。

  • 注1:第二种方式只在Linux下采用,Win平台对应的方法没有找到。

另外:有些人说配置文件为Rserve.conf,但我在122的/etc下找到的是Rserv.conf,不管是哪一个文件(甚至两者都不是,随便命名一个),只要执行下面命令告诉Rserve配置文件是哪一个即可(需要重启Rserve):

  1. R CMD Rserve --RS-conf Rserv.conf  
复制代码



参考资料
转自:http://blog.csdn.net/zhyh1986/article/details/13074395
阅读更多

没有更多推荐了,返回首页