pyspark 中 读取 hive 表,提示 hdfs 中的 nameservice 不识别

前言

本文隶属于专栏《Spark异常问题汇总》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见 Spark异常问题汇总

正文

问题描述

pyspark 中 读取hive表,提示 hdfs 中的 nameservice 不识别

Caused by: java.net.UnknownHostException: gbigdata

问题补充

本地 跑 是好的,但是 到 jupyter 上就有问题

环境

配置的 python 环境是 anaconda3

定位思路

  1. 查一下core-site.xml里的fs.defaultFS属性

在这里插入图片描述

  1. 查一下 nn 端口配置和移动转移的配置
  2. 查一下hdfs-site.xml里的nameservice
  3. 查一下host配置映射,可能主机地址没有映射
  4. 用代码调试的时候,查一下上下文,配置文件加载可能出错了
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值