spark整合hbase

12 篇文章 0 订阅
6 篇文章 0 订阅

 

 

spark联合hbase可以将hbase的数据转化为RDD数据,便于spark操作

如何使它们联合呢

 

直接编辑spark-env.sh这个文件即可

准备工作:

hadoop,hbase需要有被配置成环境变量

 

开始:

在spark-env.sh文件中添加 export SPARK_DIST_CLASSPATH=$(hadoop classpath):$(hbase classpath)

 

然后就bin/spark-shell 启动,然后写入一下内容:

 

import org.apache.spark._;
import org.apache.spark.rdd.NewHadoopRDD;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.mapreduce.TableInputFormat;
val configuration = HBaseConfiguration.create();  //初始化配置
configuration.set("hbase.zookeeper.property.clientPort", "2181");
configuration.set("hbase.zookeeper.quorum", "localhost");
configuration.set("hbase.master", "localhost:60000");
configuration.addResource("/home/spark/app/hbase-0.96.2-hadoop2/conf/hbase-site.xml");
configuration.set(TableInputFormat.INPUT_TABLE, "pv");//连接到hbase的表
import org.apache.hadoop.hbase.client.HBaseAdmin;
val hadmin = new HBaseAdmin(configuration); //实例化hbase管理

 

 

使用hadoop api创建一个RDD

val hrdd = sc.newAPIHadoopRDD(configuration, classOf[TableInputFormat],classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
classOf[org.apache.hadoop.hbase.client.Result])

 

hrdd.take(1)

val a = hrdd.collect()

a.top(2)

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值