SBT编译spark-redis-master

spark-redis-master是用来让spark更简单地操作redis
将源码下载后解压缩到E盘,运行sbt,下载依赖jar包
这里写图片描述
run结果出错
这里写图片描述

采用官方教程
第一步:配置git,mvn命令

yum -y install git
git --version

vim /etc/profile
export PATH=/usr/local/git/bin:$PATH
source /etc/profile

git --version

maven安装包下载

tar -xvf  apache-maven-2.2.1-bin.tar.gz

mv -rf apache-maven-3.0.3 /usr/local/

MAVEN_HOME=/usr/local/apache-maven-3.0.3
export MAVEN_HOME
export PATH=${PATH}:${MAVEN_HOME}/bin

source /etc/profile

mvn -v

环境变量:etc/profile是所有用户系统环境变量,而bashrc是对单个用户而言的,环境变量就相当于东西在四楼,每次都要到四楼取,但是配置了环境变量,就即使在一楼也可以取四楼的东西

第二步:下载jar包

git clone https://github.com/RedisLabs/spark-redis.git
cd spark-redis
mvn clean package -DskipTests

编译完之后会产生两个jar包,spark-redis-0.1.1.jar和spark-redis-0.1.1-jar-with-dependencies

只读redis slave节点数据

git checkout with-slaves

启动spark,读入相应的jar包

$ bin/spark-shell --jars <path-to>/spark-redis-<version>.jar,<path-to>/jedis-<version>.jar

之后可以用spark-redis.jar了
这里写图片描述

其实从redis读取数据,直接读就可以了,spark也是基于jvm的
因为创建RDD的方式有两种(1)读取外部数据集textFile(2)在驱动程序中对一个集合进行并行化,即parallelize()方法
e.g.val lines=sc.parallelize(Lisst("panda","i like panda"),4)

在下面一节博客中会详细介绍spark读取redis数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值