HBase向多个column写入的性能分析

测试场景:

1.向一列中插入每条2K的数据

2.向100列中插入每条20byte的数据

以上两个场景,HBase写入的性能相差很大.

造成这个情况的原因是,HBase存储方式是以KeyValue来存的,每个KeyValue是由key,CF, column,TS等组成的,也就是说,HBase接受到了100列的数据,以column拆分成100个KeyValue,这样就造成了很多重复的数据,远远大于2K,同时还使MemStore频繁的刷新,这样性能就会降下来

展开阅读全文

没有更多推荐了,返回首页