kudu查询调优
问题描述kudu集群在导入大量历史数据之后,在Impala/kudu上查询变慢,之前集群查询的时间基本上在2秒左右,但是现在查询时间延长到80秒到90秒左右。这个查询时间对于任何应用都是无法忍受的。问题定位通过CDH的CM上的Impala组件中的SQL语句统计信息发现,SQL查询时间主要FragmentF00阶段的5号节点KUDU扫表,其余几个节点查询扫描时间正常。1.首先比较各个节点之间的数据扫描记录,确定是否存在数据倾斜问题。通过比较几个节点之间的扫描记录的大小,发现各个几点扫描的记






