hive命令行找不到包的问题解决

我们在操作hive的时候,一般情况下直接在命令行cli下直接敲命令就可以了,但是对于日常批量的话,需要每天都跑,这里就采用了python来执行进行每天的批量运行,用pyhive建立数据库连接,连接远程的hive数据库,然后在远程的hive环境上执行hive的sql;

一般情况下,我们在执行hql之前,需要配置环境,本次需要添加两个关于elasticsearch的lib,执行以下两个命令:

add jar /usr/hdp/2.5.0.0-1245/hive/lib/org.apache.commons.httpclient_3.1.0.v201012070820.jar;
add jar /usr/hdp/2.5.0.0-1245/hive/lib/elasticsearch-hadoop-6.1.0.jar;

执行的错误如下:

 OperationalError(TExecuteStatementResp(status=TStatus(statusCode=3, infoMessages=['*org.apache.hive.service.cli.HiveSQLException:Error while processing statement: /usr/hdp/2.5.0.0-1245/hive/lib/sorg.apache.commons.httpclient_3.1.0.v201012070820.jar does not exist:27:26', 'org.apache.hive.service.cli.operation.Operation:toSQLException:Operation.java:335', 'org.apache.hive.service.cli.operation.HiveCommandOperation:runInternal:HiveCommandOperation.java:108', 'org.apache.hive.service.cli.operation.Operation:run:Operation.java:276', 'org.apache.hive.service.cli.session.HiveSessionImpl:executeStatementInternal:HiveSessionImpl.java:468', 'org.apache.hive.service.cli.session.HiveSessionImpl:executeStatement:HiveSessionImpl.java:444', 'sun.reflect.GeneratedMethodAccessor270:invoke::-1', 'sun.reflect.DelegatingMethodAccessorImpl:invoke:DelegatingMethodAccessorImpl.java:43', 'java.lang.reflect.Method:invoke:Method.java:498', 'org.apache.hive.service.cli.session.HiveSessionProxy:invoke:HiveSessionProxy.java:78', 'org.apache.hive.service.cli.session.HiveSessionProxy:access$000:HiveSessionProxy.java:36', 'org.apache.hive.service.cli.session.HiveSessionProxy$1:run:HiveSessionProxy.java:63', 'java.security.AccessController:doPrivileged:AccessController.java:-2', 'javax.security.auth.Subject:doAs:Subject.java:422', 'org.apache.hadoop.security.UserGroupInformation:doAs:UserGroupInformation.java:1724', 'org.apache.hive.service.cli.session.HiveSessionProxy:invoke:HiveSessionProxy.java:59', 'com.sun.proxy.$Proxy23:executeStatement::-1', 'org.apache.hive.service.cli.CLIService:executeStatement:CLIService.java:273', 'org.apache.hive.service.cli.thrift.ThriftCLIService:ExecuteStatement:ThriftCLIService.java:506', 'org.apache.hive.service.cli.thrift.TCLIService$Processor$ExecuteStatement:getResult:TCLIService.java:1317', 'org.apache.hive.service.cli.thrift.TCLIService$Processor$ExecuteStatement:getResult:TCLIService.java:1302', 'org.apache.thrift.ProcessFunction:process:ProcessFunction.java:39', 'org.apache.thrift.TBaseProcessor:process:TBaseProcessor.java:39', 'org.apache.hive.service.auth.TSetIpAddressProcessor:process:TSetIpAddressProcessor.java:56', 'org.apache.thrift.server.TThreadPoolServer$WorkerProcess:run:TThreadPoolServer.java:286', 'java.util.concurrent.ThreadPoolExecutor:runWorker:ThreadPoolExecutor.java:1142', 'java.util.concurrent.ThreadPoolExecutor$Worker:run:ThreadPoolExecutor.java:617', 'java.lang.Thread:run:Thread.java:745'], sqlState=None, errorCode=1, errorMessage='Error while processing statement: /usr/hdp/2.5.0.0-1245/hive/lib/sorg.apache.commons.httpclient_3.1.0.v201012070820.jar does not exist'), operationHandle=None),)

我们在本机采用hive指令执行的时候,发现没有问题,但是采用python执行add jar的环境配置的时候出现了问题,总是显示这两个jar包不存在,经过研究发现,整个hive是一个集群,假定采用cli命令执行的服务器是A,远程连接的是B,我们只是在A上添加了如下两个包,而python采用pyhive远程连接的服务器B上没有装这两个包,导致pyhive连接到远程之后,找不到对应的包,而报如上的错误,只要加对应的jar包在服务器B上添加即可;

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值