linux中java调用R语言,R语言学习笔记之<在Linux上遇到的问题集锦>

Standalone模式:Standalone模式运行的Spark集群对不同的应用程序采用先进先出(FIFO)的顺序进行调度。默认情况下每个应用程序会独占所有可用节点的资源。

现在版本的SparkR只能运行在standalone模式下

问题1:安装问题

由于R涉及到Fortran语言,要下载gcc-gfortran包

安装步骤:1)将R-3.2.3.tar.gz解压        2)./configure       3)make         4)make install(这步可以没有)         5)配置环境变量 vi .bash_profile

./configure的时候会出现以下错误:

--with-readline=yes (default) and headers/libs are not available  这是由于需要依赖readline-devel包的缘故 yum install readline-devel即可

configure: error: cannot compile a simple Fortran program 这是由于需要依赖gcc-gfortran包的缘故 yum install gcc-gfortran即可

configure: error: --with-x=yes (default) and X11 headers/libs are not available 这是由于需要依赖libXt-devel包的缘故 yum install libXt-devel即可

以上步骤依赖了较多的包:①gcc ②gcc-c++ ③readline-devel ④gcc-gfortran ⑤libXt-devel

yum install libXt-devel

yum install readline-devel

yum install gcc

yum install gcc-c++

yum install gcc-gfortran

tar -zxvf R-3.2.3.tar.gz

cd R-3.2.3

./configure

make

问题2:

unsupported URL scheme

Warning: unable to access index for repository https://rweb.crmda.ku.edu/cran/src/contrib

镜像问题,解决方式有两种:1)换镜像,即在选择的时候改   2)install.packages("RODBC", dependencies = TRUE, repos = "http://cran.rstudio.com/")

问题3:在安装R包的时候遇见错误

configure: error: "ODBC headers sql.hand sqlext.h not found"

是因为没有在Linux 下安装ODBC包。RODBC 需要 unixODBC 和unixODBC development 包,使用YUM 安装之后即可解决。

yum install unixODBC

yum install unixODBC-devel

则之后再install.packages("RODBC", dependencies = TRUE, repos = "http://cran.rstudio.com/")

一直连不上远程数据库,要查看一下是不是网络不通,ping一下远程主机。

SparkR编程示例:

#如果直接调用的sparkR,则不用设置Sys.setenv和.libPaths,直接library(SparkR)即可

#Sys.setenv(SPARK_HOME = "D:/StudySoftWare/Spark/spark-1.5.2-bin-hadoop2.6")

#.libPaths(c(file.path(Sys.getenv("SPARK_HOME"),"R","lib"), .libPaths()))

library(SparkR)

sc 

#sc 

sqlContext 

DF 

head(DF)

localDF 

df 

# Print its schema

printSchema(df)

# root

#  |-- name: string (nullable = true)

#  |-- age: double (nullable = true)

# Create a DataFrame from a JSON file

path 

peopleDF 

printSchema(peopleDF)

# Register this DataFrame as a table.

registerTempTable(peopleDF, "people")

# SQL statements can be run by using the sql methods provided by sqlContext

teenagers = 13 AND age <= 19")

# Call collect to get a local data.frame

teenagersLocalDF 

# Print the teenagers in our dataset

print(teenagersLocalDF)

# Stop the SparkContext now

sparkR.stop()

Java.io.IOException: Cannot run program "Rscript": error=2, No such file or directory  遇到这种错误是因为:

looks like the issue was that code was looking for Rscript under "/usr/bin". Our default installation was /usr/revolutionr.

Just created a link Rscript in /usr/bin that points to /usr/revolution/bin/Revoscript

示例二:wordCount

library(SparkR)

sparkR.stop()

#调用sparkR的时候会自动的初始化一个SparkContext,默认是local模式

sc 192.168.133.11

:7077","WordCount")#sparkR.init(master = "", appName = "SparkR",sparkHome = Sys.getenv("SPARK_HOME"), sparkEnvir = list(),sparkExecutorEnv = list(), s#parkJars = "", sparkPackages = "")

lines 

words 

wordCount 

counts 

#如果要保存到hdfs中,则path要写成"hdfs://namenode主机名/user/root/test/sparkR.txt") path要给出全路径

SparkR:::saveAsTextFile(counts, "hdfs://namenode主机名/user/root/test/sparkR.txt")

##如果要保存到hdfs中,则path要写成"hdfs://namenode主机名/user/root/test/sparkR.txt") path要给出全路径

##如果要将createDataFrame(hc,生成的 sparkr dataframe 以文件形式存到hive中 需要先将其转为rdd

data_in_rdd

SparkR:::saveAsTextFile(data_in_rdd, evo_table_name_lower_with_path)

output 

R语言学习笔记之&colon; 论如何正确把EXCEL文件喂给R处理

博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html ---- 前言: 应用背景兼吐槽 继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. ...

R语言学习笔记(二)

今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言来描述. > vars

R语言学习笔记:小试R环境

买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: The Art of R Programming A Beginne ...

R语言学习笔记:基础知识

1.数据分析金字塔 2.[文件]-[改变工作目录] 3.[程序包]-[设定CRAN镜像] [程序包]-[安装程序包] 4.向量 c() 例:x=c(2,5,8,3,5,9) 例:x=c(1:100) ...

R语言学习笔记1——R语言中的基本对象

R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心 ...

R语言学习笔记——C&num;中如何使用R语言setwd&lpar;&rpar;函数

在R语言编译器中,设置当前工作文件夹可以用setwd()函数. > setwd("e://桌面//")> setwd("e:\桌面\")> s ...

R语言学习笔记

向量化的函数 向量化的函数 ifelse/which/where/any/all/cumsum/cumprod/对于矩阵而言,可以使用rowSums/colSums.对于“穷举所有组合问题" ...

R语言学习笔记:分析学生的考试成绩

孩子上初中时拿到过全年级一次考试所有科目的考试成绩表,正好可以用于R语言的统计分析学习.为了不泄漏孩子的姓名,就用学号代替了,感兴趣可以下载测试数据进行练习. num class chn math e ...

R语言学习笔记:字符串处理

想在R语言中生成一个图形文件的文件名,前缀是fitbit,后面跟上月份,再加上".jpg",先不百度,试了试其它语言的类似语法,没一个可行的: C#中:"fitbit&q ...

随机推荐

Android—Socket服务端与客户端用字符串的方式互相传递图片

发送图片: 首先找到具体传递的图片: private Bitmap getimage(String srcPath) { BitmapFactory.Options newOpts = new Bit ...

移动端&lowbar;line-height问题

如果把line-height加1px,iPhone文字就会下移,由于我们app的ios用户居多,并且android机型太多,不同机型也会显示不同,所以只能退而求其次了. line-height的兼容问 ...

在Visio2010中修改默认字体的大小

由于我常需要在Visio2010中画流程图和UML图,但是Visio2010中的字体默认8px,这对眼睛是个挑战.摸索了好久终于找到在visio2010中修改字体大小的方式. 1.点一下红色箭头所指的 ...

怎样分析java线程堆栈日志

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值