【运行环境】
hadoop-2.7.3 hive-1.2.1 Tez-0.7.0
有关Apache Tez的简介:
Tez is the next generation Hadoop Query Processing framework written on top of YARN. 它是一款基于YARN的新一代数据处理和分析框架,亮点:支持DAG调度作业,它能把多个有依赖的作业转换成一个作业,所以能大幅提升DAG性能,从而提升M-R查询性能。这一点可以从我下面的作业截图看出,count(*)查询9千万条数据在12秒内就得出结果 |
【报错现象】
在hive shell中通过tez查询count(*)时发生错误IllegalArgu