UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 246-247: ordinal not in range

在Python中处理包含中文的数据时,遇到`UnicodeEncodeError`,原因是默认编码不支持中文。针对Python2,可以尝试设置默认编码为utf8,但此方法在Python3中已废弃。对于Python3,可以使用`codecs`模块重置stdout编码为utf8,从而正确显示中文数据。
摘要由CSDN通过智能技术生成

项目场景:

在集群上写pyspark的时候遇到了这个问题


问题描述:

在进行df.show()操作的时候,由于数据中有中文,所以报错

Traceback (most recent call last):
  File "20210622_1259_test.py", line 13, in <module>
    df.show(100)
……
UnicodeEncodeError: 'ascii' codec can't encode characters in position 246-247: ordinal not in range(128)

原因分析:

网上搜了一下发现是python编码的问题,默认编码不支持中午,因此需要修改编码支持中文


解决方案:

方法一:
修改python编码为utf8就行了,添加如下代码:

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

注意:这个方法好像只针对python2有用,python3之后移除了setdefaultencoding方法,这么用会报错。

方法二:
添加如下代码:

import sys
import codecs
sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())

这个方法在python3上可以使用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值