row key长度原则
- 不应设计过长,row key是冗余存储,数据的持久化文件HFile 中是按照KeyValue 存储的,row key越长会影响Hfile的存储效率
- MemStore 将缓存部分数据到内存,Rowkey 字段过长内存的有效利用率会降低,系统将无法缓存更多的数据,这会降低检索效率
Row key散列原则
- row key尽量散列,将Rowkey的高位作为散列字段,将提高数据均衡分布在每个Regionserver 实现负载均衡的几率。避免热点访问(在做数据检索的时候负载将会集中在个别RegionServer,降低查询效率)
Row key唯一原则
- 设计上保证其唯一性。