大数据---hbase基本原理与MR操作Hbase

最新推荐文章于 2021-07-25 12:33:43 发布

Hdmtc123

最新推荐文章于 2021-07-25 12:33:43 发布

阅读量487

点赞数

分类专栏：大数据 Hbase 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hdmtc123/article/details/82392707

版权

本文介绍了HBase的基本原理，包括其在Hadoop生态中的位置、体系结构、数据写入、数据flush和合并流程。同时，详细阐述了如何使用MapReduce操作HBase，包括创建表、初始化数据及实现词频统计的MapReduce任务代码示例。

摘要由CSDN通过智能技术生成

一、基本原理
　　1.hbase的位置

　　上图描述了Hadoop 2.0生态系统中的各层结构。其中HBase位于结构化存储层，HDFS为HBase提供了高可靠性的底层存储支持， MapReduce为HBase提供了高性能的批处理能力，Zookeeper为HBase提供了稳定服务和failover机制，Pig和Hive为HBase提供了进行数据统计处理的高层语言支持，Sqoop则为HBase提供了便捷的RDBMS数据导入功能，使业务数据从传统数据库向HBase迁移变的非常方便。

　　2.体系图

　　体系图中各个组件的含义，参考：http://blog.csdn.net/carl810224/article/details/51970039/

　　　　　　　　　　　　　　　　　　https://www.cnblogs.com/qiaoyihang/p/6246424.html

　　3.基本流程　

　　1. 写流程

　　　　1、 client向hregionserver发送写请求。

　　　　2、 hregionserver将数据写到hlog（write ahead log）。为了数据的持久化和恢复。

　　　　3、 hregionserver将数据写到内存（memstore）

　　　　4、反馈client写成功。

　　2. 数据flush过程

　　　　1、当memstore数据达到阈值（老版本默认是64M），将数据刷到硬盘，将内存中的数据删除&

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据---hbase基本原理与MR操作Hbase

一、基本原理　　1.hbase的位置　　上图描述了Hadoop 2.0生态系统中的各层结构。其中HBase位于结构化存储层，HDFS为HBase提供了高可靠性的底层存储支持， MapReduce为HBase提供了高性能的批处理能力，Zookeeper为HBase提供了稳定服务和failover机制，Pig和Hive为HBase提供了进行数据统计处理的高层语言支持，Sqoop则为HBase提...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。