HBase的一个table中的所有行都按照rowkey的字典序排列,table在行的方向上分割为多个region,region是按大小分割的(默认为10G),它是HBase中分布式存储和负载均衡的最小单元,不同的region可以分布在不同的Region Server上,但一个region是不会拆分到多个Server上的。每个region由一个或者多个store组成,每个store保存一个列簇,有几个列簇就有几个store,这些store必须在一台机器上,每个store又由一个MemStore和0至多个StoreFile组成,写操作时先写入MemStore,当MemStore中的数据量达到某个阈值时就会flush到StoreFile中,StoreFile以HFile格式保存在HDFS上。
MemStore和StoreFile
最新推荐文章于 2023-02-03 08:45:00 发布