HBase基本存储原理

最新推荐文章于 2022-08-01 22:57:22 发布

11宁静致远

最新推荐文章于 2022-08-01 22:57:22 发布

阅读量3.4k

点赞数 2

分类专栏：大数据 linux

本文链接：https://blog.csdn.net/u013982921/article/details/79721240

版权

大数据同时被 2 个专栏收录

56 篇文章 0 订阅

订阅专栏

linux

15 篇文章 0 订阅

订阅专栏

 
 HBase基本存储原理： 

 
 HMaster 

 
 HMaster没有单点问题，HBase中可以启动多个HMaster，通过Zookeeper的Master Election机制保证总有一个Master运行，HMaster在功能上主要负责Table和Region的管理工作： 

 
 1.管理用户对Table的增、删、改、查操作 

 
 2.管理HRegionServer的负载均衡，调整Region分布 

 
 3.在Region Split后，负责新Region的分配 

 
 4.在HRegionServer停机后，负责失效HRegionServer 上的Regions迁移 

 
 HRegionServer 

HRegionServer主要负责响应用户I/O请求，向HDFS文件系统中读写数据，是HBase中最核心的模块。
 
HRegionServer内部管理了一系列HRegion对象，每个HRegion对应了Table中的一个Region，HRegion中由多个HStore组成。每个HStore对应了Table中的一个Column Family的存储，可以看出每个Column Family其实就是一个集中的存储单元，因此最好将具备共同IO特性的column放在一个Column Family中，这样最高效。

 
 HStore: 

 
 HStore存储是HBase存储的核心了，其中由两部分组成，一部分是MemStore，一部分是StoreFiles。MemStore是Sorted Memory Buffer，用户写入的数据首先会放入MemStore，当MemStore满了以后会Flush成一个StoreFile（底层实现是HFile），当StoreFile文件数量增长到一定阈值，会触发Compact合并操作，将多个StoreFiles合并成一个StoreFile，合并过程中会进行版本合并和数据删除，因此可以看出HBase其实只有增加数据，所有的更新和删除操作都是在后续的compact过程中进行的，这使得用户的写操作只要进入内存中就可以立即返回，保证了HBase I/O的高性能。当StoreFiles Compact后，会逐步形成越来越大的StoreFile，当单个StoreFile大小超过一定阈值后，会触发Split操作，同时把当前Region Split成2个Region，父Region会下线，新Split出的2个孩子Region会被HMaster分配到相应的HRegionServer上，使得原先1个Region的压力得以分流到2个Region上。 

                            
HLog:

 
 在理解了上述 
 HStore的基本原理后，还必须了解一下HLog的功能，因为上述的HStore在系统正常工作的前提下是没有问题的，但是在分布式系统环境中，无法避免系统出错或者宕机，因此一旦HRegionServer意外退出，MemStore中的内存数据将会丢失，这就需要引入HLog了。每个HRegionServer中都有一个HLog对象，HLog是一个实现Write Ahead Log的类，在每次用户操作写入MemStore的同时，也会写一份数据到HLog文件中（HLog文件格式见后续），HLog文件定期会滚动出新的，并删除旧的文件（已持久化到StoreFile中的数据）。当HRegionServer意外终止后，HMaster会通过Zookeeper感知到，HMaster首先会处理遗留的 HLog文件，将其中不同Region的Log数据进行拆分，分别放到相应region的目录下，然后再将失效的region重新分配，领取 到这些region的HRegionServer在Load Region的过程中，会发现有历史HLog需要处理，因此会Replay HLog中的数据到MemStore中，然后flush到StoreFiles，完成数据恢复。 

 
 HBase存储格式 

 
 HBase中的所有数据文件都存储在Hadoop HDFS文件系统上，主要包括上述提出的两种文件类型： 

 
 1.HFile， HBase中KeyValue数据的存储格式，HFile是Hadoop的二进制格式文件，实际上StoreFile就是对HFile做了轻量级包装，即StoreFile底层就是HFile 

 
 2. HLog File，HBase中WAL（Write Ahead Log） 的存储格式，物理上是Hadoop的Sequence File 

 
 HFile 

 
 下图是 
 HFile的存储格式： 

 
 首先 
 HFile文件是不定长的，长度固定的只有其中的两块：Trailer和FileInfo。正如图中所示的，Trailer中有指针指向其他数据块的起始点。File Info中记录了文件的一些Meta信息，例如：AVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEY等。Data Index和Meta Index块记录了每个Data块和Meta块的起始点。 

 
 Data Block是HBase I/O的基本单元，为了提高效率，HRegionServer中有基于LRU的Block Cache机制。每个Data块的大小可以在创建一个Table的时候通过参数指定，大号的Block有利于顺序Scan，小号Block利于随机查询。每个Data块除了开头的Magic以外就是一个个KeyValue对拼接而成, Magic内容就是一些随机数字，目的是防止数据损坏。后面会详细介绍每个KeyValue对的内部构造。 

 
 HFile里面的每个KeyValue对就是一个简单的byte数组。但是这个byte数组里面包含了很多项，并且有固定的结构。我们来看看里面的具体结构： 

                          
开始是两个固定长度的数值，分别表示 
 Key的长度和Value的长度。紧接着是Key，开始是固定长度的数值，表示RowKey的长度，紧接着是RowKey，然后是固定长度的数值，表示Family的长度，然后是Family，接着是Qualifier，然后是两个固定长度的数值，表示Time Stamp和Key Type（Put/Delete）。Value部分没有这么复杂的结构，就是纯粹的二进制数据了。

 
 HLogFile 

 
 上图中示意了 
 HLog文件的结构，其实HLog文件就是一个普通的Hadoop Sequence File，Sequence File 的Key是HLogKey对象，HLogKey中记录了写入数据的归属信息，除了table和region名字外，同时还包括 sequence number和timestamp，timestamp是“写入时间”，sequence number的起始值为0，或者是最近一次存入文件系统中sequence number。 

 
 HBase关键算法/流程 

 
 region定位 

 
 系统如何找到某个 
 row key (或者某个 row key range)所在的region bigtable 使用三层类似B+树的结构来保存region位置。 

 
 第一层是保存 
 zookeeper里面的文件，它持有root region的位置。 

 
 第二层 
 root region是.META.表的第一个region其中保存了.META.z表其它region的位置。通过root region，我们就可以访问.META.表的数据。 

 
 .META.是第三层，它是一个特殊的表，保存了hbase中所有数据表的region 位置信息。 

 
 说明 
 ： 

 
 1  
 、 
 root region永远不会被split，保证了最需要三次跳转，就能定位到任意region 。 

 
 2 
 、 
 META.表每行保存一个region的位置信息，row key 采用表名+表的最后一样编码而成。 

 
 3 
 、为了加快访问， 
 .META.表的全部region都保存在内存中。 

 
 假设， 
 .META.表的一行在内存中大约占用1KB。并且每个region限制为128MB。 

 
 那么上面的三层结构可以保存的 
 region数目为： 

 
 (128MB/1KB) * (128MB/1KB) = = 2(34)个region 

 
 4、client会将查询过的位置信息保存缓存起来，缓存不会主动失效，因此如果client上的缓存全部失效，则需要进行6次网络来回，才能定位到正确的region(其中三次用来发现缓存失效，另外三次用来获取位置信息)。 

11宁静致远

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
HBase基本存储原理

HBase基本存储原理：HMasterHMaster没有单点问题，HBase中可以启动多个HMaster，通过Zookeeper的Master Election机制保证总有一个Master运行，HMaster在功能上主要负责Table和Region的管理工作：1.管理用户对Table的增、删、改、查操作2.管理HRegionServer的负载均衡，调整Region分布3.在Region Split...
复制链接

扫一扫

专栏目录