spark保存数据到hbase_spark读取hbase的数据

最新推荐文章于 2021-07-15 16:59:55 发布

七分醉玲珑

最新推荐文章于 2021-07-15 16:59:55 发布

阅读量182

点赞数

文章标签： spark保存数据到hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34370877/article/details/112021303

版权

package hgs.spark.hbase

//https://blog.csdn.net/mlljava1111/article/details/52675901

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.hbase.mapreduce.TableInputFormat

import org.apache.hadoop.hbase.client.Scan

import org.apache.hadoop.hbase.filter.FilterList

import org.apache.hadoop.hbase.filter.FilterList.Operator

import org.apache.hadoop.hbase.filter.RowFilter

import org.apache.hadoop.hbase.filter.RegexStringComparator

import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp

import org.apache.hadoop.hbase.protobuf.ProtobufUtil

import org.apache.hadoop.hbase.util.Base64

import org.apache.hadoop.hbase.util.Bytes

import org.apache.hadoop.hbase.filter.LongComparator

object HbaseToSpark {

def main(args: Array[String]): Unit = {

//System.setProperty("spark.serializer", "org.apache.spark.serializer.KryoSerializer");

val conf = new SparkConf

conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

conf.setMaster("local").setAppName("hbasedata")

val context = new SparkContext(conf)

//hbase配置

val hconf = new HBaseConfiguration

hconf.set("hbase.zookeeper.quorum", "bigdata00:2181,bigdata01:2181,bigdata02:2181")

hconf.set("hbase.zookeeper.property.clientPort", "2181")

hconf.set(TableInputFormat.INPUT_TABLE, "test")

val scan = new Scan

//扫描的表rowkey的开始和结束

scan.setStartRow("1991".getBytes)

scan.setStopRow("3000".getBytes)

//val list = new FilterList(Operator.MUST_PASS_ALL)

//val filter1 = new RowFilter(CompareOp.GREATER_OR_EQUAL,new LongComparator(1991))

//val filter2 = new RowFilter(CompareOp.LESS_OR_EQUAL,new RegexStringComparator("3000*"))

// list.addFilter(filter1)

// list.addFilter(filter2)

//scan.setFilter(list)

//添加scan

hconf.set(TableInputFormat.SCAN, convertScanToString(scan))

val hrdd = context.newAPIHadoopRDD(hconf,

classOf[TableInputFormat],

classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],

classOf[org.apache.hadoop.hbase.client.Result])

val resultrdd = hrdd.repartition(2)

//打印结果

resultrdd.foreach{case(_,value)=>{

val key = Bytes.toString(value.getRow)

val name = Bytes.toString(value.getValue("cf1".getBytes, "name".getBytes))

val age = Bytes.toString(value.getValue("cf1".getBytes, "age".getBytes))

println("rowkey:"+key+" "+"name:"+name+" "+"age:"+age)

}

}

context.stop()

}

def convertScanToString(scan: Scan) = {

val proto = ProtobufUtil.toScan(scan)

Base64.encodeBytes(proto.toByteArray)

}

}

七分醉玲珑

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark保存数据到hbase_spark读取hbase的数据

packagehgs.spark.hbase//https://blog.csdn.net/mlljava1111/article/details/52675901importorg.apache.spark.SparkConfimportorg.apache.spark.SparkContextimportorg.apache.hadoop.hbase.HBaseConfiguratio...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。