当表被创建时,HBase默认只会为该表分配一个region,那么,初始状态时所有的请求都会集中在一个Region Server上,当大量数据写入时,该节点将成为热点。
当然,region热点不仅体现在创建表阶段。对于一张拥有很多region的大表来说,其在Region Sever上的分布往往不会十分均匀,region较多的Region Server在有大量数据写入时,它的负载也会大于其他region数少的Region Server,这也是热点。
因此,针对上述两种情况,该如何避免热点发生就是一个常见的话题。
解决办法:
合理设计rowkey能让各个region的并发请求平均分配,使IO效率达到最高。