spark保存数据到hbase_spark 数据写入到 hbase

最新推荐文章于 2023-05-04 23:00:00 发布

weixin_39576018

最新推荐文章于 2023-05-04 23:00:00 发布

阅读量518

点赞数

文章标签： spark保存数据到hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39576018/article/details/111546801

版权

1)spark把数据写入到hbase需要用到：PairRddFunctions的saveAsHadoopDataset方法，这里用到了 implicit conversion，需要我们引入

import org.apache.spark.SparkContext._

2)spark写入hbase，实质是借用了org.apache.hadoop.hbase.mapreduce.TableInputFormat这个对象，用其内部的recorderWriter将数据写入hbase

同时，也借用了hadoop的JobConf，配置和写MR的配置方式一样

3)请看下面代码,这里使用sparksql从hive里面读出数据，经过处理，写入到hbase

//创建jobConf

val conf = HBaseConfiguration.create()

val jobConf = new JobConf(conf)

jobConf.setOutputFormat(classOf[TableOutputFormat])

jobConf.set(TableOutputFormat.OUTPUT_TABLE,"test")

//创建hiveContext

val sparkConf = new SparkConf().setAppName("test")

val sc = new SparkContext(sparkConf)

@transient val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)

sqlContext.setConf("spark.sql.shuffle.partitions","3")

//保存到hbase

val rdd = sqlContext.sql("select C1,C2,C3 from test")

.map(row => {

val c1 = row(0).asInstanceOf[String]

val c2 = row(1).asInstanceOf[String]

val c3 = row(2).asInstanceOf[String]

val p = new Put(Bytes.toBytes(c1))

p.add(Bytes.toBytes("f"),Bytes.toBytes("c2"),Bytes.toBytes(c2))

p.add(Bytes.toBytes("f"),Bytes.toBytes("c3"),Bytes.toBytes(c3))

(new ImmutableBytesWritable,p)

}).saveAsHadoopDataset(jobConf)

weixin_39576018

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
spark保存数据到hbase_spark 数据写入到 hbase

1)spark把数据写入到hbase需要用到：PairRddFunctions的saveAsHadoopDataset方法，这里用到了implicit conversion，需要我们引入import org.apache.spark.SparkContext._2)spark写入hbase，实质是借用了org.apache.hadoop.hbase.mapreduce.TableInputFor...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。