sparkR 安装

最新推荐文章于 2018-04-24 22:50:51 发布

cy19871228cy

最新推荐文章于 2018-04-24 22:50:51 发布

阅读量400

点赞数

分类专栏：安装文章标签： sparkr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cy19871228cy/article/details/79262937

版权

安装专栏收录该内容

4 篇文章 0 订阅

订阅专栏

SparkR的安装和配置

1 集成在CLOUDERA MANAGER里

由于cdh集成的spark2不支持sparkR所以要手动将sparkR的相关内容放入spark2的目录下

1 下载已经编译过的spark2包

wget https://d3kbcqa49mib13.cloudfront.net/spark-2.1.0-bin-hadoop2.7.tgz

2 安装sparkR

解压后找到spark-2.1.0-bin-hadoop2.6/R/lib/sparkr.zip

将它传到10.118.220.186 187 188 189 4台机器$SPARK_HOME/R/lib/sparkr.zip

并且解压生成SparkR目录

3 安装R

在10.118.220.186 187 188 189 4台机器上安装R

然后把SparkR目录复制到每台机器的/usr/local/lib64/R/library目录下

4 配置sparkR

spark-defaults.conf文件里加

spark.yarn.dist.archives=/appslog/packs/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2/sparkr.zip#sparkr

spark-env.sh文件里加

export SPARK_DIST_CLASSPATH=$(hadoopclasspath)

SparkR的例子

Wordcount

R里面执行

if(nchar(Sys.getenv("SPARK_HOME")) < 1) {

Sys.setenv(SPARK_HOME ="/appslog/packs/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2")

}

library(SparkR)

sc <-sparkR.session(master="yarn-client")

lines <-read.text("hdfs://10.118.220.186:8020/tmp/sparkR_test.txt")

createOrReplaceTempView(lines,"lines")

resault <- sql("SELECTvalue,count(1) FROM lines group by value")

head(resault)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
sparkR 安装

SparkR的安装和配置1 集成在CLOUDERA MANAGER里由于cdh集成的spark2不支持sparkR所以要手动将sparkR的相关内容放入spark2的目录下1 下载已经编译过的spark2包wget https://d3kbcqa49mib13.cloudfront.net/spark-2.1.0-bin-hadoop2.7.tgz2 安装sparkR解
复制链接

扫一扫

专栏目录

cy19871228cy CSDN认证博客专家 CSDN认证企业博客

码龄15年

5: 原创

45万+: 周排名

170万+: 总排名

5780: 访问

: 等级

99: 积分

3: 粉丝

4: 获赞

2: 评论

6: 收藏

私信

关注

热门文章

分类专栏

安装 4篇
配置 2篇

最新评论

Hudi实战
邻村傻二蛋: 感觉hudi和kudu是做同件事情，在保证了性能的情况下解决了大数据中更新和删除的问题。不同点是hudi的存储可以基于hdfs，而kudu只能本地文件系统。楼主这么一说，我也感觉是的。
sparkR 安装
joy05: spark.yarn.dist.archives=/appslog/packs/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2/sparkr.zip#sparkr是不是有点问题啊,是不是该这样配置呢：spark.yarn.dist.archives=/appslog/packs/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2/R/lib/sparkr.zip#sparkr

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。