HBase 基本原理

最新推荐文章于 2023-07-21 10:17:36 发布

原创最新推荐文章于 2023-07-21 10:17:36 发布 · 366 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

14. 大数据同时被 2 个专栏收录

86 篇文章

订阅专栏

-------14.9. HBase

5 篇文章

订阅专栏

前言

作为Hadoop体系中BigTable中的具体实现. HBase中主要解决的如何存储数据, 并建立相应索引, 快速查找数据. 其特性是写快, 读慢.

本章就简单的聊聊这些过程: 存储数据/查找数据.

基础知识

在前面的章节內, 已经讲过HBase內主要有如下的组成部分.
在这里插入图片描述

Table
Row Key
Columns Family
Cell
Time Stamp

这边不再重复啰嗦. 详细请看HBase Shell 基本使用中, 基础知识的部分.

基本原理

整体组件概览
RegionServer 主要作用是对于多个Region管理, 以及对其HFile(物理I/O)与MemStore(内存)的管理.其主要的组件为:
- HLog用于记录操作日志. HRegion存储器, 其中又细分为多个Store.HLog 是一个AppendLog,只能添加, 不能修改.
- 每个Stroe内分为MemStore(内存存储)与StoreFile/HFile(路径存储).
HMaster主要负责RegionServer的调度工作.
- 对Table的增删查改.
- Region在哪台RegionServer上.
- Region Split(重新分片)后, 对于Region的分配.
- 宕机和加入新机器后的重新分配.
ZooKeeper主要负责协助HMaster和HRegion完成工作. 主要作用在于配置调度文件的共享.

存储数据

Client端向HRegionServer发生写请求;
HRegionServer将数据写入HLog(write ahead log). 为了数据的持久化和恢复.
HRegionServer将数据写入内存MemStore.
反馈client,写入成功.

数据flush过程

写数据时, 客户端通过ZooKeeper定位, 找到一台RegionServer. 随后, 通过HDFS API将数据写入HDFS内.

当MemStore内的数据到达128M后, 将内存内数据写入硬盘(HDFS), 同时删除HLog中的历史数据.
在HLog内标记点.

读取数据

Client通过ZooKeeper查询到记录该表Root表所在的结点;
通过Root表寻找到相应的Meta表.
通过Meta表查找真正存储数据的结点. (如果数据在内存内, 直接返回; 如果在HDFS内, 从HDFS上获取.)

数据拆分&数据合并&宕机

合并: 将多个HDFS块内的数据进行合并, 合并成新的HDFS块. 目的是, 删除冗余.
拆分: 当某个HDFS块过大时, 将其拆分成小块. 目的是, 提高运行和查询的效率.
宕机: 当RegionServer宕机后, HMaster将RegionServer上的HLog拆分给其他RegionServer, 并修改.META表.

HMaster依赖ZooKeeper

保存HMaster地址,和backup-master地址;
1.1 管理HregionServer;
1.2 做增删改查的操作;
1.3 管理HregionServer的表分配;
保存表 -ROOT地址. (HBase默认根目录,检索表)
HRegionServer列表.(表的增三改查,和dfs交互,存储数据.)

Others

与传统的RDBMS的B+树型结构不同的是, HBase文件系统采用LVS的形式存储.
具体可以看下HBase核心概念（LSM树、底层持久化、Region切分合并、日志

Reference

[1]. HBase Region合并分析
[2]. 详解HBase架构原理
[3]. HBase核心知识点总结
[4]. 一篇文章让你了解Hive和HBase的区别
[5]. 总结Hbase 与 MongoDB
[6]. HBase使用场景和成功案例
[7]. 聊聊MySQL、HBase、ES的特点和区别

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。