一般性能问题(查询、插入数据慢)可从以下几个方面进行初步排查:
①对应表是否正常,hbase hbck检查,是否存在RIT或inconsitencies ,如有用dstools修复。
②是否存在读写热点,可去60010界面查看对应表的region分布情况和rs的请求是否均匀。
③rs节点是否存在GC情况,可以jstat gcutil或使用grep -i “JvmPause” <rs.log> | grep WARN 查看对应时间段的gc情况
④检查是否建立二级索引并且是否生效,可以通过desc formatted tb查看。(查询)。
⑤提前预分region,一般一个region 5-10G最佳,若数据量较大,考虑使用bulkload方式(插入)
⑥检查集群的负载情况,CPU、IO、内存等。
⑦释放空间:
* 只有major compact的过程会清理过期的数据
大合并占用性能严重可以定期,比如三五天或者
一周找个负载低的时候清理一下
* 手动Majopr Compaction