python操作hdfs_使用python访问hdfs | 学步园

使用非Java语言访问hdfs有两种方法,一种是利用libhdfs.so来访问hdfs,另一种是使用thrift通信框架来访问,这里暂先介绍libhdfs

1、先安装libhdfs

# 前提是安装jdk6、jre6,利用cloudera.repo来安装hadoop-0.20

sudo yum –y install libhdfs*

2、安装python-devel(2.6+), gcc

sudo yum –y install python-devel gcc

3、下载libpyhdfs源码, 准备依赖包

svn checkout http://libpyhdfs.googlecode.com/svn/trunk/ libpyhdfs

cd libpyhdfs

cp /usr/lib/hadoop-0.20/hadoop-core-0.20.2-cdh3u0.jar lib/hadoop-0.20.1-core.jar

cp /usr/lib/hadoop-0.20/lib/commons-logging-1.0.4.jar lib/

cp /usr/lib/libhdfs.so.0 lib/

ln –s lib/libhdfs.so.0 lib/libhdfs.so

4、配置setup.py, 修改Java环境路径

vim setup.py

include_dirs = ['/usr/lib/jvm/java-6-sun/include/']

->  include_dirs = ['/usr/java/jdk1.6.0_24/include/']

runtime_library_dirs = ['/usr/local/lib/pyhdfs', '/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值