hbase优点
hbase是一个列式存储的非关系型数据库,依赖于zookeeper。数据存储于hdfs上,主节点是HMaster,从节点是HRegionServer.
hbase与关系型数据库相比较优点如下:
1. hbase数据存储于hdfs上,可扩展性强。数据条目数可以存储上一条。
2. 通过rowkey检索数据,速度可以准实时,达到秒级别。
3. 写数据非常快,只要写在Region的memstore内存中即可,不需要重复IO消耗。
4. 每份数据都有多份备份,保证数据安全性。
5. 从成本上来说关系型数据库要用到商用小型机,价格要几百万非常昂贵。但是hdfs只需要普通的商用server,只要几万一台。
hbase数据模型
region介绍
每个表刚开始只有一个region,region的strartRowKey和endRowKey都是空的。当region的大小超过一定的阀值后,就会按照key的中间值分裂成两个region,老的region下线。比如中间值是111000,则新的2个region如下:
null
region1
111000
region2
null
rowkey按照大小排序,新的rowkey会按照大小插入对应的region