问题描述:通过MR、Tez运行同一个SQL,发现获得的结果不一致,MR有数据,而Tez没数据
原因:tez内部的优化,默认批处理,导致没数据
解决方案:https://issues.apache.org/jira/browse/HIVE-13330
Ps:
SET hive.vectorized.execution.enabled=false;
或
SET hive.optimize.index.filter=true;
spark ,tez查询都有数据,mr查询没数据
1、show create table xxxx;找出表的位置
2、hadoop fs -ls 查看表存储数据的文件是否有 HIVE_UNION_SUBDIR_X这类型的目录存在
解决方案:
set hive.mapred.supports.subdirectories=true;
set mapreduce.input.fileinputformat.input.dir.recursive=true;