【python 连接hive】python 连接hive

一、需要安装模块

pip install sasl
pip install thrift
pip install thrift-sasl
pip install pyhive

Thrift,sasl 要求最新版本

pip安装遇到的sasl问题,产生此问题的原因是由于缺少gcc c++相关的包:安装就好了。

yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64  
pip install pyhs2  

二、代码模块

# -*- encoding=utf-8 -*-
import time
time1=time.time()
import pandas as pd
from pyhive import  hive

cursor=hive.connect(host='XXXXXXXXXXXX',port='10000',username='dongli').cursor()



sql="""


此处放sql脚本

"""
cursor.execute(sql)

data=pd.DataFrame(cursor.fetchall())

print(data.head())


time2 = time.time()
print('总共耗时:' + str(time2 - time1) + 's')

方法二:采用Impyla连接

# -*- encoding=utf-8 -*-


from impala.dbapi import connect
import pandas as pd

conn=connect(host='XXXXXXXXX',port='XXXX',database='XXX',auth_mechanism='PLAIN')


cur=conn.cursor()

cur.excute("show databases")

data=pd.DataFrame(cur.fetchall())
cur.close()

conn.close()

参考连接:https://blog.csdn.net/dendi_hust/article/details/97294198

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东华果汁哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值