1. pyhive
pyhive 是可以用于连接hive的python库,安装方式如下
pip install sasl
pip install thrift
pip install thrift-sasl
pip install PyHive
2. 连接数据库
连接数据库,如果需要设置密码,那么必须制定auth参数
from pyhive import hive
conn = hive.Connection(host='192.168.0.1', port=15000, username="kwsy",password='password', auth='CUSTOM')
3. 查询数据
query_sql = "select * from users"
curosr = conn.cursor()
curosr.execute(query_sql)
# 获得列的信息
clumns = curosr.description
# 获取全部数据,result是tuple
for result in curosr.fetchall():
print(result)
curosr.close()
查询结果以tuple的形式返回,与之对应的列信息存放在curosr.description 中,如果你想最终以字典的形式获得数据,那么需要你根据description 和result进行组装
4. HiveClient
自己编写一个HiveClient 类吧,只