参考:https://www.jianshu.com/p/20aff7d85e95
https://www.yiibai.com/hbase/hbase_update_data.html
HBase是一个分布式、面向列的开源数据库,它是一个高可靠、高性能、面向列、可伸缩的分布式存储系统;
Hbase 具有如下特性:强一致的读写性;
自动分片:Hbase 表通过region 分布在集群中,数据增长时,region会自动分割并重新发布;
RegionServer 自动故障转移;
HDFS 集成:Hbase支持HDFS作为它的文件系统;
MapReduce作为大数据处理;
1. 应用场景:Hbase 确保有足够多的数据,如果是上亿或者上千亿行的数据,HBase是很好的备选。如果只是几千行,那么则用传统的RDBMS可能是更好的选择,Hbase提供快速随机访问的数据;
其次,确信可以不依赖所有的RDBMS的额外特性。列如:列数据类型,第二索引,事务、高级查询语言;
最后,确保有足够的硬件。因为底层HDFS文件存储系统,在小于5个节点的时候,不能体现出的他的优势;
2. 优缺点:
优点:面向列,列可以动态增加,并且列为空就不存储数据,节省存储空间;
Hbase 可以自动切分数据,使得数据存储自动具有水平扩展功能;
HBASE支持高并发的读写操作的支持;
Hbase与MapReduce相结合有利于数据分析;
缺点:不支持条件查询,只支持rowkey来查询;
容易尝试单点故障;
不支持事务;