1 简介
R是统计计算的强大工具,而JAVA是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以创建JAVA对象调用JAVA方法,另一方面,JAVA中可以转换R的数据类型调用R的函数,互相取长补短。现在也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R互相调用。
关于R中调用JAVA,我想主要是为了利用其面向对象的特性,毕竟R语言近来很致力于向面向对象发展,有个很好的项目rJava可以实现,在www.rforge.net/rJava上。R中调JAVA对我似乎意义不大,本文主要介绍JAVA中调用R。
JAVA很适合开发应用系统,但是数学建模和计算能力非其所长,如果该系统需要进行大量的统计或者优化的计算,调用R是一种很好的方式。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。
目前网上有两种方式使用java调用R。
2 Rserve的方式
2.1 介绍
首先要介绍的是Rserve的方式,这是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。目前Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器,就可以供客户端调用。
其客户端可以有多种,这里只介绍JAVA客户端。最早的客户端包是JRclient,在www.rosuda.org/Rserve上还可以下载到,但是现在该项目全部移到了www.rforge.net/Rserve,使用REngine作客户端(和JRI一致),在该网站下可以下载到REngine.jar和RserveEngine.jar两个文件。如果用eclipse开发的话,在工程属性中导入这两个外部的jar包,就可以正常使用了。
首先建立一个新的连接,然后就可以使用eval之类的方法将R中的表达式传到服务器端,通过R求值后传回JAVA中REXP类型的变量,然后打印出来,整个过程非常简单。由于不需要对R进行初始化,因此速度会比较快。在其他系统下可以同时建立多个连接,但是在Windows下只允许同时打开一个连接,后续的连接都会共有相同的命名空间。官网上不建议在Windows下使用Rserve,因为会丧失很多性能,他们推荐可以考虑DCOM的方式。不过DCOM那个工程没有现成的jar包可用,其实如果是拿R做分析系统中的运算引擎,单连接够用了。
2.2 操作步骤
(一) 在R里下载“Rserve”包,并安装
安装好后,
运行如下命令启动“Rserver”
> library(Rserve) > Rserve()
Starting Rserve... "D:\PROGRA~1\R\R-30~1.1\library\Rserve\libs\i386\Rserve.exe" > |
(二) 建立java工程,导入必要的包,写出测试用例
目录结构如下(标红色的是需要的):
Test.java 内容
package com.rTest;
import org.rosuda.REngine.REXP; import org.rosuda.REngine.Rserve.RConnection;
public class Test { public static void main(String[] args) { try { RConnection c = new RConnection(); REXP x = c.eval("R.version.string"); System.out.println(x.asString()); } catch (Exception e) { e.printStackTrace(); } } } |
运行即可
2.3 可能出现的错误
2.3.1 Connection refused: connect
org.rosuda.REngine.Rserve.RserveException: Cannot connect: Connection refused: connect at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:88) at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:60) at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:44) at com.rTest.Test.main(Test.java:9)
|
这是由于“Rserve” 服务器没有启动起来的原因,试试在R内运行如下语句
> library(Rserve) > Rserve()
|
3 JRI 的方式
3.1 介绍
另一种方式是JRI,全名是Java/R Interface,这是一种完全不同的方式,通过调用R的动态链接库从而利用R中的函数等。目前该项目已经成了rJava的子项目,不再提供单独的JRI的版本。因此使用时简单地通过install.packages("rJava")安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,里面有自带的例子可以用来测试。
装好后要修改系统的环境变量,在PATH中添加%R_HOME%/bin和%R_HOME%/library/rJava/jri,注意R_HOME的路径要正确,重启系统使之生效。使用时同样在eclipse里导入外部的jar包(在www.rforge.net/rJava下载JRI.jar、REngine.jar和JRIEngine.jar这三个文件),在rJava包安装目录下的jri/examples里有现成的例子(rtest.java和rtest2.java),可以测试是否成功。
3.2 重要的一步 Spring MVC的项目中调用语言
可以说大多数的开发人员最重要的目的就是把这个rjava运用到项目中去。在这个步骤中,我将这个调用的方法写成了一个工具类,但是我遇见了两个大的问题,第一个,因为在项目是在tomcat中发布的,所以tomcat在加载的时候没有找到R的.dll文件,这个问题可以通过System.out.println(System.getProperty("java.library.path"));这句话,找到你用的那个tomcat下面加载文件的目录,将这个jri.dll放进去,重新运行这个就行了。第二个,是我在写工具类的时候发生的一个错误,我没有考虑到自己会多次使用到这个工具,从而导致我的电脑启动了很多个JVM,内存溢出,死机。这个问题,是通过一个单例模式的建立来解决的,我只让这个Rengine在项目中被实例化一次,这样子,他就只能被启动一次,不会导致电脑死机等等
一定要注意jdk的配置路径,确保环境变量的正确性。
3.3 可能出现的错误
3.3.1 Cannot find JRI native library!
Press <Enter> to continue (time to attach the debugger if necessary)
Creating Rengine (with arguments) Cannot find JRI native library! Please make sure that the JRI native library is in a directory listed in java.library.path.
java.lang.UnsatisfiedLinkError: no jri in java.library.path at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1860) at java.lang.Runtime.loadLibrary0(Runtime.java:845) at java.lang.System.loadLibrary(System.java:1084) at org.rosuda.JRI.Rengine.<clinit>(Rengine.java:19) at com.rTest.rtest2.main(rtest2.java:73) |
检查下path是否正确,如果正确 ,如果配置环境正确,1)用System.out.println(System.getProperty("java.library.path"));输出java.library.path,结果如下:
D:\develop\Java\jdk1.7.0_40\bin;D:\develop\Java\apache-tomcat-8.0.0-RC5\bin
这个信息中的前者是java的安装目录,后者是tomcat的安装目录,把jri.dll分别拷到这两个目录。然后测试问题是否解决。