HBase是一个在HDFS上开发的面向列的分布式数据库。从逻辑上来讲,HBase将数据按照表、行和列进行存储。与HDFS一样,HBase主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。HBase表的特点如下:
降低了系统的I/O性能。
- 容量大:一个表可以有数十亿行,上百万列。当关系型数据库的单个表的记录在亿级时,则查询和写入的性能都会呈现指数级下降,而HBase对于单表存储百亿或
- 无固定模式(表结构不固定):每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然并的列。
- 面向列:面向列的存储和权限控制,支持列独立检索。关系型数据库是按行存储的,在数据量大的时候,关系型数据库依赖索引来提高查询速度,而建立索引和更新
降低了系统的I/O性能。
- 稀疏性:空(null)列并不占用存储空间,表可以设计的非常稀疏。
- 数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳。
- 数据类型单一:HBase中的数据都是字符串,没有类型。
- 高性能:针对Rowkey的查询能够达到毫秒级别。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2134652/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/15498/viewspace-2134652/