搜索了一下,网上大多都是使用thrift1来链接hbase的,其实,现在线上大多使用的都是thrift2协议,那么到底python使用thrift2怎样连接hbase呢?
下面是具体步骤:
1,下载thrift2库:http://thrift.apache.org/ 下载最新的 0.9.2 src版本(最新的为0.10),如果要以前的版本,也可到 http://archive.apache.org/dist/thrift 去下载 ,
也可以 ,GIT Checkout,svn co 等等
2,编译安装:具体有多种方法,Maven,./configure make make install ...
3,生成py代码:thrift -o <output directory{默认当前目录gen-py}> -gen py {对应版本的hbase源码地址}\src\main\resources\org\apache\hadoop\hbase\thrift2
(或直接下载我生成好的code,见本文下方下载链接)
4,将对应版本中python接口code复制到当前操作目录,{对应版本的thrift2源码地址}\lib\py\src...
5,参考sql脚本:
假设此表的创建结构如下:
create 'topic_test',{NAME => 'cf', VERSIONS => 5}, SPLITS=>['10