由于hive查询结果是不能直接保存到mysql的,有人会用sqoop,相对还是不方便。当然了,肯定还有一些其它的hive~mysql互导工具,通常我们用python驱动hiveserver2,hivecli官方并不建议,也利用python将结果保存到mysql。那么python操作hive查询结果保存到mysql过程是怎么样的呢?
1、需要的包
网上百度,搜到的包不外乎下面3个,这里用第二个。
1、pyhs2,已没有更新维护
https://github.com/BradRuderman/pyhs2
2、pyhive
https://github.com/dropbox/PyHive
3、impyla
https://github.com/cloudera/impyla
2、我们选择pyhive
安装基本顺利,安装过程如下:
# 这个不装会报错,会有错误提示
pip install thrift
pip install pyhive
你以为安装完了吗,连接hive时报错:
ImportError: No module name