hbase调优
1、高可用
Hmaster 负责监控 RegionServer 的生命周期,均衡 RegionServer 的负载
2、预分区
3、rowkey的设计
散列原则、长度原则
4、hbase的列族不宜太多,两个就已经很多了(列族多会增加寻址,影响效率;如,region分裂时,是按rowkey来切割,会被分到不同hregionserver上,寻址复杂)
5、关闭Hlog(因地制宜,提高写性能)
6、是否立即刷写磁盘(memstore刷写磁盘、region分裂大小)
7、对hbase的写数据尽量批量操作(因为写数据根据rowkey写,如果存在多个列族会到对应目录下插入)
hbase的参数配置优化:
hbase.hregion.memstore.flush.size 默认128M,数据写入速度非常快的时候可以调整加大内存(memstore刷写磁盘)
hbase.hregion.max.filesize 默认大小10G(region分裂)
hbase.hregion.majorcompaction major合并的时间
默认7天执行一次,将多个storefile合并,会将过期的,超出版本数量的、标记为删除的数据都
进行删除(一般要在系统空闲的时候去做,因为需要大量的磁盘IO),一般会设置手动执行
hbase.regionserver.handler.count hregionserver的操作线程数