region
表的行范围数据,将一张大的表分成多个region,将region分配给不同的regionServer机器管理
region中有
store 一个列族对应一个store(列族的抽象对象)
memorystore 用来写数据.先将数据写到内存中,然后对整个hfile中的数据排序
WALG 日志. 记录用户的行为.
storefile hdfs中hfile的抽象对象,相对应
blockcache 提升查询效率
namespace
表
列族
列的分类管理
- 不要太多,容易造成过量的小文件和过多的文件夹
- 命名不要太长
行健
- 行的唯一标识
- 索引
- 一维排序(排序第一条件)
- 布隆过滤器
属性
稀疏性
值
字节数据