在R中运行Spark

Linux下安装R

1.        安装依赖

yum install gcc

yum installgcc-c++

yum installgcc-gfortran

yum installpcre-devel

yum installtcl-devel

yum installzlib-devel

yum installbzip2-devel

yum installreadline-devel

yum install libXt-devel

yum installtk-devel

yum installtetex-latex

为了防止devtools包装不上先安装这几个依赖

yum installlibcurl-devel

yum installopenssl-devel

yum installlibxml2-devel

yum installlibcurl libcurl-devel

2.        首先上传安装文件:R-3.2.4-revised.tar.gz

3.        解压文件:tar -zxvf R-3.2.4-revised.tar.gz

4.        进入R源文件目录:cd R-revised

5.        新建目录:mkdir -p /home/SparkRsoftware/R

6.        执行编译命令

./configure --prefix=/home/SparkR/software/R--enable-R-shlib

(--prefix是关键,R是自建文件夹)

配置通过,但是会产生如下warning:

configure:WARNING: you cannot build DVI versions of the R manuals

configure:WARNING: you cannot build DVI versions of all the help pages

configure:WARNING: you cannot build info or HTML versions of the R manuals

configure:WARNING: you cannot build PDF versions of the R manuals

configure: WARNING: you cannot build PDF versions of allthe help pages

这是缺少生成相应格式manuals的插件,如果有需要可以依次安装。

7.        make

8.        make install

9.        配置环境变量

vim .bash_profile

exportR_HOME=/home/SparkR/R-revised

export PATH=$PATH:$R_HOME/bin

source .bash_profile

10.    如果PDF没有装成功的话,图形只能从linux上下载到本地看了。所以再装PDF吧。

11.    安装成功。进入R命令行界面,可以操作。但是tab自动补全以及上下左右等方向键都无法使用。想着应该是./configure --with-readline=no --with-x=no惹的祸。因此重新安装了一下,这次在执行./configure命令前先执行了命令:

yum install readline-devel(解决错误“--with-readline=yes (default) and headers/libs are not available”)

yum install libXt-devel(解决错误“–with-x=yes(default) and X11 headers/libs are not available”)

12.    最终安装成功,并且tab自动补全等都有效。

13.    如何在浏览器即时看到所做的图:

l  secure里打开两个窗口

l  一个窗口里:cd 到有R图形pdf文件的文件下

l  执行python -mSimpleHTTPServer

l  别关掉,它会一直挂在那里

l  在另一个窗口,你就可以作图了,做完保存

l  随便打开一个浏览器输入url:你的机器名:8000

l  就可以看你你做的图了。

14.    写sh执行的R脚本时,脚本开头增加如下内容:

#!/home/SparkR/R-revised /bin/Rscript

/home/SparkR/R-revised /bin 为R的安装路径

测试:

为SparkR用户新建对/opt目录的操作权限

chown -R SparkR.SparkR /opt

cd /opt/script/R

vim t.R

#!/path/to/Rscript

x<-c(1,2,3)

y<-c(102,299,301)

model<-lm(y~x)

summary(model)

执行脚本

R CMD BATCH--args /opt/script/R/t.R

more/opt/script/R/t.Rout    #查看执行的结果

或者第二种方式

Rscript /opt/script/R/test.R    #结果直接输出到终端

15.    测试R的安装:

输入R回车,R成功启动

输入如下命令测试R

x <-c(1,2,5,7,9)

y <-c(2,4,7,8,10)

plot(x,y)

abline(lm(y~x))

title("回归图像")

安装Spark

安装R的依赖包

install.packages('rJava', dependencies=TRUE, repos='http://cran.rstudio.com/')

install.packages('devtools', dependencies=TRUE, repos='http://cran.rstudio.com/')

使用SparkR

libpath <- .libPaths()
libpath <- c(libpath, "/home/SparkR/spark-1.6.1-bin-hadoop2.6/R/lib")
.libPaths(libpath)
rm(libpath)
library(SparkR)

在Spark1.4.0以后已经内置了sparkr,直接调用就可以了



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值