关于window使用Python上传hdfs文件报错解决

在从Windows系统使用Python上传文件到HDFS时遇到HTTP连接错误。解决方法是更新本地hosts文件,将Hadoop集群地址映射上去,或者使用SwitchHosts软件进行便捷配置。完成映射后,连接问题得以解决。
摘要由CSDN通过智能技术生成

关于window使用Python上传hdfs文件报错解决

之前一直在服务器上使用Python操作hdfs,一切都很顺利。但是突然转到windows系统上时就出现了http连接错误的报错信息。

代码如下:

Created on 2018年8月7日

测试spark连接hdfs
@author: rnd-002
'''
from hdfs.client import Client
import time
client = Client("http://192.168.1.181:50070")

print(client.list("/"))
print(client.list("/test"))
client.upload('/test','C:/Users/rnd-002/RData/spark_clean/spark_to_hdfs/test.txt')
print(client.list("/test"))

报错信息如下:

urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPConnection object at 0x000001B2DBDAEDD8>: Failed to establish a new connection: [Errno 11001] getaddrinfo failed

这是因为windows没有识别到hadoop地址信息,所以我们需要修改windows本机的host文件,使其映射到hadoop集群上。

配置截图如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值