背景
使用pyhive连接impala并执行sql语句,发现总是sql执行总是异常。
原因
经过跟踪源代码发现,pyhive执行sql的函数execute(),虽然指定了同步执行,但是同步只适用于执行hive的sql,对于impala来说,并没有起作用,导致实际执行的impala sql为异步的,则会出现异常情况。
方案
可人为判断sql执行情况,实现同步执行。
通过poll()函数,获取TOperationState,有如下几种状态:
INITIALIZED_STATE = 0
RUNNING_STATE = 1
FINISHED_STATE = 2
CANCELED_STATE = 3
CLOSED_STATE = 4
ERROR_STATE = 5
UKNOWN_STATE = 6
PENDING_STATE = 7
TIMEDOUT_STATE = 8
判断为FINISHED_STATE,再往下执行即可。