1、ROWKEY的设计原则
三大原则:rowkey长度原则、rowkey散列原则、rowkey唯一原则。
如何设计:1)生成随机数、hash、散列值;2)字符串反转;3)字符串拼接。
2、HBase宕机如何处理
宕机分为HMaster宕机和HRegionServer宕机。
(1)HRegionServer宕机:HMaster会将其所保管的region重新分配到其他活动的Region Server上,由于数据和日志都持久存储在HDFS上,该操作系统不会导致数据丢失,所以数据的一致性和安全性是有保证的。
(2)HMaster宕机:HMaster没有单点问题,HBase中可以启动多个HMaster,通过Zookeeper的Master Election机制保证总有一个Master运行。即Zookeeper会保证总会有一个HMaster在对外提供服务。
3、Hive和HBase的区别
共同点: HBase和Hive均是架构在Hadoop中的,都是用Hadoop作为底层存储。
区别: (1)Hive是建立在Hadoop上为了减少MapReduce Job编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目。
(2)Hive本身不存储和