Region
表的行范围数据,将一张大的表划分成多个region,将region分配给不同的regionserver 机器管理 region中有 :
1) store 一个列族对应一个store
2) memorstore 写数据 [内存] ,对整个hfile 中的数据排序
3) WALG 纪录用户的操作行为
4) storefile 内存对象 flush 到 hdfs 中形成hfile 文件 storefile 就是hfile的抽象对象
5)blockcache 提升查询效率
namespace 要点
表 namespace:tb_name
列族 列的分类管理 1) 不要太多 2)命名不能太长
行键 1) 行的唯一标识 2)索引 3)一维排序 4)布隆过滤器
属性 它是具有稀疏性的
值 一般是字节数据