spark 读取hbase中的数据

最新推荐文章于 2023-10-08 15:33:39 发布

lzz360

最新推荐文章于 2023-10-08 15:33:39 发布

阅读量2k

点赞数 1

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzz360/article/details/51753251

版权

大数据专栏收录该内容

10 篇文章 0 订阅

订阅专栏

import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.Scan
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.hadoop.hbase.protobuf.ProtobufUtil
import org.apache.hadoop.hbase.util.{Base64, Bytes}
import org.apache.spark.{SparkConf, SparkContext}

/**
* Created by lzz on 6/23/16.
*/
object HbaseRDD extends App{

val sparkConf = new SparkConf().setMaster("local")
.setAppName("My App")
.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
val sc = new SparkContext(sparkConf)

var hConf = HBaseConfiguration.create()
hConf.set("hbase.zookeeper.property.clientPort", "2181" )
hConf.set("hbase.zookeeper.quorum", "192.168.1.221,192.168.1.222,192.168.1.223" )
hConf.set("hbase.master", "hadoop006:16010" )
hConf.set(TableInputFormat.INPUT_TABLE, "user_tags")

var scan = new Scan();
scan.addFamily(Bytes.toBytes("cf"))
var proto = ProtobufUtil.toScan(scan);
var ScanToString = Base64.encodeBytes(proto.toByteArray());
hConf.set(TableInputFormat.SCAN, ScanToString);

val usersRDD = sc.newAPIHadoopRDD( hConf, classOf[TableInputFormat],
classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
classOf[org.apache.hadoop.hbase.client.Result])

val users = usersRDD.map( x => x._2 )
.map( result => ( result.getRow, result.getValue( Bytes.toBytes("cf"),Bytes.toBytes("h1") )) )
.map( row => ( new String(row._1), new String(row._2) ) )
.foreach( r => ( println( r._1 + "----" + r._2 ) ) )

}

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lzz360 CSDN认证博客专家 CSDN认证企业博客

码龄12年

94: 原创

13万+: 周排名

159万+: 总排名

44万+: 访问

: 等级

4503: 积分

54: 粉丝

88: 获赞

30: 评论

85: 收藏

私信

关注

热门文章

分类专栏

php 49篇
javaWeb(Struct2) 6篇
javaWeb(hibernate) 9篇
javaWeb(spring) 2篇
c# 4篇
android 4篇
uml 1篇
设计模式 2篇
网站前端 17篇
SEO 2篇
数据库 3篇
Asp.net 3篇
AJAX 4篇
Linux 32篇
c&c++ 1篇
nosql 1篇
R 5篇
大数据 10篇
docker 2篇
python 2篇

最新评论

类图顺序图活动图状态图用法和比较
青春依旧_: 我倒觉得先顺序图，后类图。顺序图会强迫你用类似mvc的模式思考（边界、控制、实体），基于该视角分解下得到系统交互中可能的类，通过交互传递的消息与箭头等抽出函数与属性，最终得到类图
类图顺序图活动图状态图用法和比较
熊猫队长-: 角度新颖
如何进行路由器的端口映射让外网可以访问内网的机器
mango_ling: 您好，我想问下公网的IP地址是电信公司分配得是动态的，这样也可以外网也可以访问吗。而且浏览器获得的公网IP地址跟路由器的公网IP不同的。
Asp.net MVC4 使用EF实现数据库的增删改查
LPcomeon: 特别感谢博主！！！谢谢谢谢谢谢我刚开始自学 MVC+EF //1,将实体对象加入EF对象容器中，并获取伪包装类对象 DbEntityEntry<Customer> entry = db.Entry<Customer>(model); //2,将伪包装类对象的状态设置为unchanged entry.State = System.Data.EntityState.Unchanged; 这两句代码我出现的问题我说下写上DbEntityEntry 报红说我缺少using 就using System.Data.Entity.Infrastructure;就好了这时EntityState报红了我就在Data和EntityState之间加了个Entity （entry.State = System.Data.Entity.EntityState.Unchanged;）就好了 ^_^ 不知道大家遇到这个问题没有再次谢谢博主(#^.^#)
Asp.net MVC4 使用EF实现数据库的增删改查
你猜我猜你猜我猜不猜啊i: 非常好，刚好目前在学习mvc

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。