Spark读取HBase的小Demo

最新推荐文章于 2021-07-15 16:59:55 发布

月是天心不愈伤

最新推荐文章于 2021-07-15 16:59:55 发布

阅读量230

点赞数

分类专栏： Spark 文章标签： Spark Hbase

本文链接：https://blog.csdn.net/qq_42698034/article/details/100704678

版权

Spark 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

package HBase

import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.Result
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.hadoop.hbase.util.Bytes

object SparkReadHBase {
  /**
    * 此demo可以获取HBase中所有数据并转化成RDD
    * @param args
    */
  def main(args: Array[String]): Unit = {

    val conf: SparkConf = new SparkConf()
      .setAppName("HBaseTest")
      .setMaster("local[*]")

    val sc = new SparkContext(conf)

    val tablename = "myspace:test"
    val hbaseconf = HBaseConfiguration.create()
    //设置zookeeper集群地址,
    hbaseconf.set("hbase.zookeeper.quorum","tianxiang01,tianxiang03,tianxiang04,tianxiang05")
    //设置zookeeper连接端口,默认是2181
    hbaseconf.set("hbase.zookeeper.property.clientPort","2181")
    hbaseconf.set(TableInputFormat.INPUT_TABLE,tablename)

    //读取数据并转化成RDD
    val HBaseRDD = sc.newAPIHadoopRDD(
      hbaseconf,
      classOf[TableInputFormat],
      classOf[ImmutableBytesWritable],
      classOf[Result]
    )

     val count = HBaseRDD.count()
      println(count) // 1

      HBaseRDD.foreach{
        case (_,result) => {
          val key = Bytes.toString(result.getRow)
          val ziduan = Bytes.toString(result.getValue("ziduan".getBytes(),"ziduan".getBytes))
          println(key+" "+ziduan) // 1  12.19
        }
      }
  }
}

月是天心不愈伤

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark读取HBase的小Demo

package HBaseimport org.apache.hadoop.hbase.HBaseConfigurationimport org.apache.hadoop.hbase.client.Resultimport org.apache.hadoop.hbase.io.ImmutableBytesWritableimport org.apache.hadoop.hbase.map...
复制链接

扫一扫