Hbase是一个分布式列式数据库,列存储读取不存在冗余,行存储可以一次性存入。
1.表->HTable
2.按RowKey范围分为Region---HRegion--Region Servers
3.HRegion按列簇---多个HStore
4.HStore--memstore+HFiles(均为有序的KV)
5.HFiles--HDFS
说明:HRegion是HBASE中分布式存储和负载均衡最小的单元。最小单元表示不同的HRegion可以分布在不同的HRegion Server上,但一个HRegion不能也不会拆分到不同的HRegion Server上。
HRegion虽然是分布式存储的最小单元,但并不是存储的最小单元。当客户端不断向内存memStore写数据达到128M时就生成了StoreFile。
每个Hstore和col