物理存储结构以逻辑存储结构中的部分数据为例:
personal_info | office_info | |||||
Row Key | name | city | phone | telephone | address | |
row_key1 | 张三 | 北京 | 131 | 010 | 北京市 |
上面的数据,在hbase中的物理存储格式为:
Row Key | Column Family | Column Qualifier | TimeStamp | Type | Value |
row_key1 | personal_info | name | t1 | Put | 张三 |
row_key1 | personal_info | city | t2 | Put | 北京 |
row_key1 | personal_info | phone | t3 | Put | 131 |
row_key1 | personal_info | phone | t4 | Put | 138 |
row_key1 | office_info | telephone | t5 | Put | 010 |
row_key1 | office_info | address | t6 | Put | 北京市 |
上面表格中的数据,当触发数据落盘的条件时,会将上述的数据存储到HDFS中。
详解
TimeStamp
在HBase中,修改和新增是一个操作,不同版本的数据,根据timestamp进行区分,即在相同的条件数据下,通过判断时间戳的大小来返回该显示的正确数据。
Type
对数据的操作类型,新增、修改类型为Put,删除操作类型为Delete。
在内存中,我们可以看到历史数据、重复数据的存在。但是在数据落盘后,会对这些数据进行删除