大数据---hbase基本原理与MR操作Hbase

本文介绍了HBase的基本原理,包括其在Hadoop生态中的位置、体系结构、数据写入、数据flush和合并流程。同时,详细阐述了如何使用MapReduce操作HBase,包括创建表、初始化数据及实现词频统计的MapReduce任务代码示例。
摘要由CSDN通过智能技术生成

一、基本原理
  1.hbase的位置

  上图描述了Hadoop 2.0生态系统中的各层结构。其中HBase位于结构化存储层,HDFS为HBase提供了高可靠性的底层存储支持, MapReduce为HBase提供了高性能的批处理能力,Zookeeper为HBase提供了稳定服务和failover机制,Pig和Hive为HBase提供了进行数据统计处理的高层语言支持,Sqoop则为HBase提供了便捷的RDBMS数据导入功能,使业务数据从传统数据库向HBase迁移变的非常方便。

  2.体系图

  体系图中各个组件的含义,参考:http://blog.csdn.net/carl810224/article/details/51970039/

                  https://www.cnblogs.com/qiaoyihang/p/6246424.html

  3.基本流程 

  1. 写流程

    1、 client向hregionserver发送写请求。

    2、 hregionserver将数据写到hlog(write ahead log)。为了数据的持久化和恢复。

    3、 hregionserver将数据写到内存(memstore)

    4、 反馈client写成功。

  2. 数据flush过程

    1、 当memstore数据达到阈值(老版本默认是64M),将数据刷到硬盘,将内存中的数据删除&

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值