hive.max-split-size:控制Hive表拆分的最大大小。增加此值可以减少拆分数量,从而减少查询开销。
hive.max-initial-split-size:控制初始拆分的最大大小。增加此值可以加快查询启动速度。
hive.max-outstanding-splits:控制同时处理的最大拆分数量。增加此值可以提高并行度,但也会增加内存使用量。
hive.max-split-iterator-threads:控制用于生成拆分的线程数。增加此值可以加快拆分生成速度。
hive.orc.max-buffer-size:控制ORC文件读取器的最大缓冲区大小。增加此值可以提高读取性能,但也会增加内存使用量。
hive.orc.stream-buffer-size:控制ORC文件读取器的流缓冲区大小。增加此值可以提高读取性能,但也会增加内存使用量。
hive.orc.max-read-block-size:控制ORC文件读取器的最大块大小。增加此值可以提高读取性能,但也会增加内存使用量。