Hive-为什么没有启动MapReduce任务
涉及到关键参数:
- hive.fetch.task.conversion
- hive.fetch.task.aggr
- hive.fetch.task.conversion.threshold
问题的背景:
(1)查询sql
select * from dim_beeper.dim_beeper_trans_match_driver_bid where p_day=’2017-06-06’ and source_id = 1594007;
(2)dim_beeper_trans_match_driver_bid是按照p_day来进行的分区表
(3)dim_beeper_trans_match_driver_bid的存储格式为parquet
(4)dim_beeper_trans_match_driver_bid在p_day=2017-06-06分区下,包含两个文件,每个文件的大小如下:
(5)执行上面的sql会出现OutOfMemoryError错误
=====
在执行上面的sql时,由于是简单的selec