systemctl start rpcbind
1.hive.vectorized.execution.enabled参数在CDH5的Hive中默认是开启的,矢量查询(Vectorized query) 每次处理数据时会将1024行数据组成一个batch进行处理,而不是一行一行进行处理,这样能够显著提高执行速度。
2.但当该参数开启后,会与ORC格式文件的Hive表冲突,也会导致本文第一章所描述的报错,该jira是在Hive2才修复的,所以要在CDH6中才会修复,具体参考一个非常大的jira包:
https://issues.apache.org/jira/browse/HIVE-11981
https://issues.apache.org/jira/browse/HIVE-16314