对于这个,我只能说自己是脑残,日了狗了;一定把记下来;弄了接近一个周才算完成(刚开看着网上的弄,就是不成功,而且网上的例子还是比较多的,但是都比较老了,有些都是四五年前的了,所以弄起来各种烦;曾经有一度想选择用thrift了);
开始我们的安装之旅:
首先要获取libhdfs.so;
及下载一个hadoop就可以了,我用的是hadoop2.5.2;具体位置可以用find查找(我的在hadoop/lib/native/中)
其次是下载libpyhdfs和配置;
地址:https://github.com/dengzhp/libpyhdfs
进入其目录:
cd libpyhdfs
然后mkdir lib
然后把刚才下载的hadoop中的*.jar文件全部copy到lib中(网上只复制hadoop-core-1.0.3.jar、commons-logging-1.1.1.jar这两个文件,但由于我下的这个版本中不存在hadoop-core-1.0.3.jar,所以就把全部的.jar复制到lib中去了,显然是可以的);
然后把上文提到的libhdfs.so.0.0.0copy到/usr/lib64中;然后给他建立一个软连接;
ln –s /usr/lib64/libhdfs.so.0.0.0 /usr/lib64/libhdfs.so
最后直接python setup.py install –prefix=’/usr’
组后–prefix的目录最好是你python 模块的路径;最开始我的安装成功了但是就import出错,提示没有改木块,然后修改安装路径为python的模块路径后就好了!