简介
HBase是模仿google bigtable的开源产品,又是hadoop的衍生品,hadoop作为离线计算系统已经得到业界的普遍认可,并经过N多公司大规模使用的验证,自然地认为Hbase也将随之获得成功。
《HBase: The Definitive Guide》第8章讲述hbase的架构,从架构上看,其架构很完美:
- LSM - 解决磁盘随机写问题(顺序写才是王道);
- HFile - 解决数据索引问题(只有索引才能高效读);
- WAL - 解决数据持久化(面对故障的持久化解决方案);
- zooKeeper - 解决核心数据的一致性和集群恢复;
- Replication - 引入类似MySQL的数据复制方案,解决可用性;
此外还有:自动分拆Split、自动压缩(compaction,LSM的伴生技术)、自动负载均衡、自动region迁移。
HBase的一致性
关于HBase的一致性模型,众说纷纭,到底是强一致性还是最终