hbase 物理存储

最近在看hbase,看官方文档的时候有一点疑问。在文档中说,hbase的数据文件是以列族在存储的,一个表里不同的列族存储在不同的文件中,列族里面的rowkey是顺序的。虽然在写入文件之前,hbase会对写入的数据先放在memstore里面进行排序,然后写入hfile。但是如果后面又来了一批有序的rowkey需要flush到文件,但是这些rowkey可能比文件中最后一条数据的rowkey小,他是flush之前会做什么操作么.突然想起来了在,hfile的大小是基于hadoop的,因此一般是64M。memstore一次flush相当于一个文件,所以哈哈。。。

还有看到一个,说在创建表的时候不要用它内置的方法去提前设置region数目。这个在我们做项目的时候得到了验证,当时我们提前分配了100个region给一个table,防止hotspoting。但是发现基本没起什么作用。

转载于:https://www.cnblogs.com/yimapingchuan/p/4994942.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值