spark 数据写入到 hbase

最新推荐文章于 2023-02-27 19:25:39 发布

匿名啊啊啊

最新推荐文章于 2023-02-27 19:25:39 发布

阅读量2.6k

点赞数

分类专栏： HBase

本文链接：https://blog.csdn.net/qq_41851454/article/details/81225355

版权

1）spark把数据写入到hbase需要用到：PairRddFunctions的saveAsHadoopDataset方法，这里用到了 implicit conversion，需要我们引入

import org.apache.spark.SparkContext._

2）spark写入hbase，实质是借用了org.apache.hadoop.hbase.mapreduce.TableInputFormat这个对象，用其内部的recorderWriter将数据写入hbase

同时，也借用了hadoop的JobConf，配置和写MR的配置方式一样

3）请看下面代码,这里使用sparksql从hive里面读出数据，经过处理，写入到hbase

package savehbase

import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.Put
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapred.TableOutputFormat
import org.apache.hadoop.hbase.util.Bytes
import org.apache.hadoop.mapred.JobConf
import org.apache.spark.sql.hive.HiveContext
import org.apache.spark.{SparkConf, SparkContext}

object SaveHbase3 {
  def main(args: Array[String]): Unit = {
    val config = HBaseConfiguration.create()
    val jobCo

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

匿名啊啊啊

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
spark 数据写入到 hbase

1）spark把数据写入到hbase需要用到：PairRddFunctions的saveAsHadoopDataset方法，这里用到了 implicit conversion，需要我们引入import org.apache.spark.SparkContext._2）spark写入hbase，实质是借用了org.apache.hadoop.hbase.mapreduce.TableInpu...
复制链接

扫一扫