在HDFS中,要实现对文件的操作,一般可以在shell中发送指令完成,但这样太麻烦了。
当然我们可以调用HDFS的API,这里我们可以使用python的pyHdfs库来实现对HDFS的文件操作。
一、环境准备
1、python3.5
2、pyHdfs
二、pyHdfs安装
1、pip3 install --upgrade pip
先更新pip,防止版本过低
2、pip3 install pyHdfs
三、调用方法
详细的可见官方文档
1、实例化客户端
from pyhdfs import HdfsClient
client = HdfsClient(hosts='localhost:50070')
print(client.list_status('/'))
2、各类方法列举
(1)