HBASE修炼之路——00001
简介
1、列式存储:对于特定的查询,不是所有的值都是必需的。
2、压缩:列的数据类型天生是相似的,更利于压缩(增量压缩、 前缀压缩)
3、HBASE:
1)不是一个列式存储的数据库;
2)利用了磁盘上的列存储格式进行存储数据;(与RDBMS相似)
3)适合键值对、有序的数据存取;
4、减轻数据库的CPU和I/O压力:
1)读写分离;
2)增加缓存;
3)分区;
5、非关系型数据库系统 Not-Only-SQL(简称NoSQL)
6、一致性:
1)严格一致性:数据的变化时原子性的;
2)顺序一致性:依照操作执行的顺序而变化;
3)因果一致性:依照因果关系的顺序而变化;
4)最终一致性:广播来保证副本的一致性;
5)弱一致性:广播的顺序来保证副本的一致性,客户端顺序可能不一样;
7、CAP定理(CAP theorem)
一个分布式系统只能同时实现一致性、可用性和分区容忍性(或分区容错性)中的两个
8、mapreduce + GFS
1)缺乏实时随机存取数据的能力;
2)不适合存储成千上万的小文件;(因为文件的元数据信息最终要存储在主节点的内存中,文件越多主节点压力越大)
9、2006年–BigTable
A Distributed Storage System for Structured Data