Hbase为啥列镞的数量不能过多,官网的解释加自己的理解 首先,刷新和 压缩是按区域进行的,如果一个列镞携带来大量数据,当达到给定大小(hbase.hregion.memstore.flush.size)时,就会将内容刷新到StoreFile,而Store中的StoreFile会因为时间的推移而增加,压缩就是为了减少Store中StoreFiles的数量,将一些StoreFile合并,这样可以提高读取操作的性能,但压缩需要大量资源,并且可能会阻碍性能 回过头看列镞,由于一个刷新是会连带将相邻的列镞也进行刷新的,所以如果存在过多的列镞,就会产生过多的刷新,同样的增加了StoreFile的数量,数量一旦增多,就需要压缩,从而也就影响到了性能 总之,按官网说的准没错,列镞不要超过2~3个
Hbase列族的作用
最新推荐文章于 2024-08-22 09:35:03 发布