1、HBase的特点是什么
1)大:一个表可以有数十亿行,上百万列;
2)无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;
3)面向列:面向列(族)的存储和权限控制,列(族)独立检索;
4)稀疏:空(null)列并不占用存储空间,表可以设计的非常稀疏;
5)数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳;
6)数据类型单一:Hbase中的数据都是字符串,没有类型。
2、HBase和Hive的区别

① 两者是什么?
Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce
本文详细介绍了HBase的核心特点、与Hive的区别、适用场景,以及HBase中的rowKey设计原则、scan和get操作、缓存与批量设置的使用。此外,还探讨了HBase的cell结构、启动流程、compaction机制、数据存储正确性和性能优化方法,以及如何通过HTable API为Web前端提供接口。文章深入浅出地阐述了HBase的内部机制,包括其线程安全问题和并发问题,并提供了HBase在模型设计、读写性能提升等方面的关键要点和实践建议。
订阅专栏 解锁全文

382

被折叠的 条评论
为什么被折叠?



