HBase
文章平均质量分 82
PunWinger
这个作者很懒,什么都没留下…
展开
-
HBase的compact分析
HBase是基于LSM树存储模型的分布式NoSQL数据库。LSM树对比普遍的B+树来说,能够获得较高随机写性能的同时,也能保持可靠的随机读性能(可参考这里)。在进行读请求的时候,LSM树要把多个子树(类似B+树结构)进行归并查询,对于HBase来说,这些子树就是HFile(还包括内存上的树结构MemStore)。因此归并查询的子树数越少,查询的性能就越高。Compact的作用原创 2015-07-29 19:13:28 · 1824 阅读 · 0 评论 -
HBase写请求分析
HBase作为分布式NoSQL数据库系统,不单支持宽列表,并且对于随机读写来说也具有较高的性能。在高性能的随机读写事务的同时,HBase也能保持事务的一致性。目前HBase只支持行级别的事务一致性。本文主要探讨一下HBase的写请求流程,主要基于0.98.8版本的实现。客户端写请求 HBase提供的Java client API是以HTable为主要接口,对应其中的HBase表原创 2015-07-11 14:21:16 · 2825 阅读 · 1 评论 -
HBase读请求分析
HBase为了提供实时查询,以及较高性能的写请求事务吞吐量,对读/写请求都做了大量的优化。经过阅读源码和远程调试,大致了解了读请求的流程。本文主要是基于HBase的0.98.8版本的实现。客户端读请求 HBase为客户端提供了的读请求API主要有两个,get和scan。其中,get是通过指定单个的rowKey,获取其对应的value值。而scan是指定startRow和sto原创 2015-07-11 14:11:10 · 2901 阅读 · 0 评论 -
HBase的split分析
HBase在新建一个表的时候,默认会把所有数据都会放在一个HRegion上,主节点HMaster根据一定的策略把HRegion分配到不同的HRegionServer从节点上,客户端在进行读写操作的时候,就会访问对应HRegionServer的HRegion。当HRegion的数据量超过阀值的时候,为了防止单个热点访问带来的压力,HBase就会对HRegion进行split操作,一个父HRegion原创 2015-07-31 17:50:17 · 1899 阅读 · 0 评论