Hbase学习笔记

1.Table中行是按照row key的字典序排列的

2.在行的方向上分隔为多个region

3.Hregion是Hbase 中分布式存储和负载均衡的最小单位,这表示不同的Region可以分布在不同的RegionServer上

    当一个region足够大时,(现在是256M),就会split,一个region会拆分为2个。  


4.每个region由一个或多个store组成,每个store存储了一个columnfamily,每个store包含一个memstore、 0或者多个storefile;当storefile足够大时,会compact


当写入数据时,会先写入HLog中,再写入memstore,如果memstore的大小已经足够大,就会flush,把数据存储到storefile中;

当读数据时,会先从memstore中读取,如果没有才会找storefile。StoreFile以HFile格式保存在HDFS上。


meta 存储了region的信息

root 存储了meta的信息


每个regionserver维护一个HLog

好处:写操作方便

缺点:如果该regionserver下线,恢复数据时,需要把该台region server上的数据分发到多个region上。


Sequence File 的Key是HLogKey对象,HLogKey中记录了写入数据的归属信息,除了table和region名字外,同时还包括 sequence number和timestamp,timestamp是”写入时间”,sequence number的起始值为0,或者是最近一次存入文件系统中sequence number。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值