数据库:mysql ,oracle,mongdb,neo4j
列的存贮,效率会更快一些。
非结构化:MySQL数据库
半结构化 :
rowkey:行键、主键
在HBASE中只有delete,没有update,select,delete。取数据的时候只能通过rowkey去查询。
row key设计的时候,越短越好。
colume family,和colume
列族和列
三大范式:
HBASE的架构
HBASE中的数据最终都是要以文件的形式存储在hdfs中的
hregionserver:表数据,可以有多态数据。
同一个列族中的数据是要存放在同一个列族中的。
客户端有两个:一个是metastore,另一个是blockcache
zookeeper:保证集群中任何时候有且仅有一个正在工作的master。
hregionserver被切分之后,会存放在另一台region上去。
合并会涉及到两个合并,一个是在内存中,另一个是在region中。