python hbase API (一) thrift2环境准备

11 篇文章 0 订阅

一、搭建hbase集群,安装thrift服务并启动

安装步骤:https://blog.csdn.net/qq_21153619/article/details/82250725

  • cd /usr/hdp/2.6.2.0-205/hbase/bin/
  • ./hbase-common.sh start thrift

二、Thrift API 

在网上很多人说在hbase根目录下存在Hbase.thrift文件,但是我没有找到,没办法,只能去官网下载

http://archive.apache.org/dist/hbase/1.1.2/


hbase-1.1.2-bin.tar.gz 这个文件,然后找到里面的hbase-thrift文件夹,解压出来,拷贝到任意目录,然后使用如下命令,生成python使用的Thrift API: 

  • mkdir -p /usr/local/hbase
  • tar -zxvf hbase-1.1.2-src.tar.gz 
  • cd /usr/local/hbase/hbase-1.1.2/hbase-thrift/src/main/resources/org/apache/hadoop/hbase/thrift
  • thrift –gen py Hbase.thrif 


然后把生成的gen-py文件夹下的hbase文件夹,拷贝到python的包路径下(/usr/local/python3/lib/python3.6/site-packages)就可以使用了。 
后期修改:发现这个包生成的hbase包已经不能用了,需要使用pip安装hbase-thrift即可。

三、安装thrift和hbase-thrift

  • pip install thrift
  • pip install hbase-thrift

注:若装conda,可以用conda install ... 安装

安装完成之后第一次运行,报错误:

in <module> from hbase import Hbase File 
"C:\Users\tianxiao\AppData\Local\Programs\Python\Python36\lib\site-packages\hbase\Hbase.py", line 2066 
except IOError, io: ^ SyntaxError: invalid syntax

原因是python版本带来的语法兼容性问题,下载python3的Hbase文件,替换Hbase文件/usr/local/python3/lib/python3.6/site-packages/hbase/Hbase.py和ttypes.py
下载地址为:https://github.com/626626cdllp/infrastructure/tree/master/hbase

四、hbase API

#!/usr/bin/python3
# -*- coding: UTF-8 -*-

from thrift import Thrift
from thrift.transport import TSocket, TTransport
from thrift.protocol import TBinaryProtocol
from hbase import Hbase
from hbase.ttypes import *
import pandas as pd
from hbase.Hbase import *

class hbaseUtils(object):
    __slots__ = ['transport', 'client']

    # @staticmethod
    def __init__(self):
        # server端地址和端口,web是HMaster也就是thriftServer主机名,9090是thriftServer默认端口
        transport = TSocket.TSocket('172.8.10.145', 9090)
        # 可以设置超时
        transport.setTimeout(5000)
        # 设置传输方式(TFramedTransport或TBufferedTransport)
        self.transport = TTransport.TBufferedTransport(transport)
        # 设置传输协议
        protocol = TBinaryProtocol.TBinaryProtocol(self.transport)
        # 确定客户端
        self.client = Hbase.Client(protocol)

详细API见:python hbase  API (二) 

https://blog.csdn.net/qq_21153619/article/details/86502624

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值