MapReduce中实现对HBase中表的操作二

最新推荐文章于 2020-12-22 20:44:16 发布

qwurey

最新推荐文章于 2020-12-22 20:44:16 发布

阅读量5k

点赞数

分类专栏： Hadoop 文章标签： mapreduce hbase 读取数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeruby/article/details/20001309

版权

Hadoop 专栏收录该内容

21 篇文章 1 订阅

订阅专栏

1.从hbase中读取数据

2. 写map\reduce过程

3. 输出数据到hdfs中

首先要了解我们需要用TableMapper.class读取hbase中的数据到map\reduce任务中：

注意TableMapper的输出key、value是Writeable，输入key、value是固定的！而且我们必须在程序中指定map的输出key、value类型。

		job.setMapOutputKeyClass(Text.class);
		job.setMapOutputValueClass(Text.class);

通过构建连接hbase的htable来配置job：

		Configuration conf = new Configuration();
		HTable table = new HTable(conf,tablename);  
		Job job = new Job(table.getConfiguration(),"ReadDataFromHBase");

通过配置scan来控制需要获取hbase的table中的哪些数据：

		Scan scan = createHBaseScan();
		if(null==scan) {
			System.out.println("error : scan = null");
			System.exit(1);
		}
		TableMapReduceUtil.initTableMapperJob(tablename, scan, Map.class,
				ImmutableBytesWritable.class, Put.class, job);

在map函数中，通过分析result来取得结果。

		@Override
		public void map(ImmutableBytesWritable key, Result value, Context context) throws IOException,InterruptedException{
			String row = Bytes.toString(value.getRow());
			String val = Bytes.toString(value.getValue(Bytes.toBytes("content"), Bytes.toBytes("count")));
			keyout.set(row);
			valueout.set(val);
			context.write(keyout, valueout);
		}

reduce即是正常的reduce过程。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

qwurey CSDN认证博客专家 CSDN认证企业博客

码龄13年

443: 原创

9万+: 周排名

201万+: 总排名

169万+: 访问

: 等级

1万+: 积分

400: 粉丝

594: 获赞

223: 评论

1432: 收藏

私信

关注

热门文章

分类专栏

On the Way 3篇
Some Tips 16篇
Java 34篇
Coding 14篇
Hadoop 21篇
Hive 8篇
poj 59篇
PaperWriting 1篇
algorithm & data structure 13篇
Design pattern 1篇
Play 11篇
Linux 30篇
Spark 6篇
OS 1篇
leetcode 234篇
mysql 10篇
machine learning 5篇
tool 6篇
python 2篇
pg 6篇
Ambari 8篇
sqoop 1篇
rpc
flume 9篇
zookeeper 1篇

最新评论

x86虚拟地址到物理地址的映射学习
MonkeyKing-空: 是不是有些错误？为什莫就直接到线性地址了？，还是跳过了虚拟地址的转换过程？？？
对于ESP、EBP寄存器的理解
weixin_46111444: 刚想说
最小生成树Prim算法理解
暖暖好: 为什么要和之前的lowcost数组比较更新（比原来的lowcost[]小才更新数组），而不是直接更新啊（直接把邻接矩阵那一行代入），是有什么深意吗？
MapReduce中实现对HBase中表的操作一
菜菜的大数据开发之路: 膜拜技术大佬,来我博客指点江山吧
最小生成树Prim算法理解
EasonHua: 代码可以被hack掉数据： 5 18 2 4 276 3 3 435 3 4 608 2 4 860 1 2 318 1 3 547 5 4 419 2 5 98 1 5 460 5 3 399 3 5 240 3 2 733 3 3 903 4 2 909 5 2 206 3 4 810 2 1 115 2 3 419 答案：729

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。