【pyhive】本地使用pyhive连接hive数据库踩的坑

最新推荐文章于 2024-05-13 09:36:38 发布

象在舞

最新推荐文章于 2024-05-13 09:36:38 发布

阅读量4.4k

点赞数 4

分类专栏： Hive 纠错文章标签： hive pyhive

本文链接：https://blog.csdn.net/gdkyxy2013/article/details/106761446

版权

纠错同时被 2 个专栏收录

61 篇文章 2 订阅

订阅专栏

Hive

18 篇文章 4 订阅

订阅专栏

OK，本文来看看本地在PyCharm中使用pyhive连接hive数据库时踩过的坑吧，先看看一眼小编的测试代码~

首先是封装了一个连接hive获取数据的类，因为是测试，所以写的简单了些，如下：

'''
@File  : sql.py
@Author: xzw
@Date  : 2020/6/14
@Desc  : 封装类
'''

from pyhive import hive
import pandas as pd


class TestHive(object):
    '''
    连接Hive获取数据
    '''

    def __init__(self, host, port, username, database):
        '''
        初始化方法
        :param host: 地址
        :param port: 端口号
        :param username: 用户名
        :param database: 数据库名称
        '''
        self.conn = hive.Connection(host=host, port=port, username=username, database=database)

    def get_data(self, sql):
        '''
        获取数据
        :param sql: SQL语句
        :return: 返回得到的数据
        '''
        data = pd.read_sql(sql, self.conn)
        return data

然后是测试类：

'''
@File  : manager.py
@Author: xzw
@Date  : 2020/6/14
@Desc  : 访问Hive获取数据
'''

from connect_hive.sql import TestHive
from fastapi import FastAPI
import uvicorn

app = FastAPI()


@app.get("/get_hive_data")
def get_data():
    '''
    获取hive中的数据
    :return:
    '''
    host, port, username, database = 'cdh-master', 10000, 'hive', 'test'
    instance = TestHive(host, port, username, database)
    result = instance.get_data("select * from xzw")
    return {"result": result}


if __name__ == '__main__':
    uvicorn.run(app="manager:app", host="127.0.0.1", port=9999, reload=True, debug=True)

上面就是整个过程的简单代码，想象着很快就能拿到hive中的数据了，然后……坑来了~

第一个坑：

thrift.transport.TTransport.TTransportException: Could not start SASL: b'Error in sasl_client_start (-4) SASL(-4): no mechanism available: Unable to find a callback: 2'

解决办法是在Connection中添加auth="NOSASL"：

self.conn = hive.Connection(host=host, port=port, username=username, database=database, auth="NOSASL")

第二个坑：

Connection Issue: thrift.transport.TTransport.TTransportException: TSocket read 0 bytes

解决办法是在hive-site.xml中增加下面属性：

<property>
	<name>hive.server2.authentication</name>
	<value>NOSASL</value>
</property>

当然，小编使用的是CDH搭建的集群，直接在监控界面配置即可，如下所示：

象在舞

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录