Same query, different results --Tez，MR

最新推荐文章于 2024-10-01 23:58:04 发布

W609392362

最新推荐文章于 2024-10-01 23:58:04 发布

阅读量511

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/W609392362/article/details/90642896

版权

hadoop 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

问题描述：通过MR、Tez运行同一个SQL，发现获得的结果不一致，MR有数据，而Tez没数据
原因：tez内部的优化，默认批处理，导致没数据

解决方案：https://issues.apache.org/jira/browse/HIVE-13330 

Ps:
SET hive.vectorized.execution.enabled=false;

或

SET hive.optimize.index.filter=true;

spark ,tez查询都有数据，mr查询没数据

1、show create table xxxx;找出表的位置

2、hadoop fs -ls 查看表存储数据的文件是否有 HIVE_UNION_SUBDIR_X这类型的目录存在