1. 前言
目前python3连接hive的方法主要是使用cloudera开发的impyla包,但是要安装impyla也不是那么容易的事情,因为impyla要使用系统底层模块,所以就要先安装对应的模块,而不仅仅是安装impyla就可以了。如果是想hdfs-server就好了,一个http就能搞定。
在过大网友的无私奉献,以及Google和Baidu的帮助下,终于解决了python3连接hive的问题。
需要注意的是,centos和Ubuntu的系统底层模块安装和更新是不一样的,这个需要注意。
后来cloudera开发了一个新的python包叫ibis,也是用来操作hive数据的,看其博客说得神乎其神,似乎是impyla的改进升级版,将来要用ibis替换掉impyla,也使用了一下,还是可以的。
下面先说impyla的安装和使用,再说ibis的使用。
2. centos安装
先安装和更新cyrus,sasl,和gcc。这些方法在centos容器中也是一样可行的。
sudo yum install cyrus-sasl-devel
sudo yum install gcc-c++
安装python模块,注意,thrift-sasl版本和hive版本要对应,如果不知道多试几次就好了。