JAVA hbase groupby_Spark 读取Hbase表数据并实现类似groupByKey操作

最新推荐文章于 2022-04-26 13:33:23 发布

魔屋

最新推荐文章于 2022-04-26 13:33:23 发布

阅读量152

点赞数

文章标签： JAVA hbase groupby

本文链接：https://blog.csdn.net/weixin_42188533/article/details/114567061

版权

一、概述程序运行环境很重要，本次测试基于：hadoop-2.6.5spark-1.6.2hbase-1.2.4zookeeper-3.4.6jdk-1.8废话不多说了，直接上需求

Andy column=baseINFO:age,value=21

Andy column=baseINFO:gender,value=0

Andy column=baseINFO:telphone_number,value=110110110

Tom column=baseINFO:age,value=18

Tom column=baseINFO:gender,value=1

Tom column=baseINFO:telphone_number,value=120120120

如上表所示，将之用spark进行分组，达到这样的效果：

[Andy,(21,0,110110110)]

[Tom,(18,1,120120120)]

需求比较简单，主要是熟悉一下程序运行过程

二、具体代码

package com.union.bigdata.spark.hbase;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.mapreduce.TableSplit;import org.apache.hadoop.hbase.util.Base64;import org.apache.hadoop.hbase.util.Bytes;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.SparkConf;import org.apache.spark.api.java.function.Function;import org.apache.spark.api.java.function.Function2;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.client.Scan;import org.apache.hadoop.hbase.client.Result;import org.apache.hadoop.hbase.io.ImmutableBytes

最低0.47元/天解锁文章

魔屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JAVA hbase groupby_Spark 读取Hbase表数据并实现类似groupByKey操作

一、概述程序运行环境很重要，本次测试基于：hadoop-2.6.5spark-1.6.2hbase-1.2.4zookeeper-3.4.6jdk-1.8废话不多说了，直接上需求Andy column=baseINFO:age,value=21Andy column=baseINFO:gender,value=0Andy column=baseINFO:telphone_number,value=...
复制链接

扫一扫