1.介绍
Hbase是基于HDFS存储的
2.Hbase的存储
关系型数据库,有2个维度来确定某个具体的值,行 和 列
Hbase有4个维度来确定某个具体的值,行键、列族、列名、时间戳,(其中时间戳是系统默认生成的所有只用前3个 就能确认唯一值),时间戳是因为HDFS生成文件后无法修改,Hbase只能通过时间戳方式来覆盖旧数据。系统默认会取最新时间戳。
Hbase中某个具体的数值,叫单元格, Hbase的读写都是以单元格进行的,读写不是以数据行进行。
3.Hbase分布式存储
Hbase会根据行键 和列族 进行分区,把不同的分区放到不同的机器上进行存储,
然后取数据时候,会根据元数据字典表,记录不同数据存储在哪些机器上。