成功解决文件读写时UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 31-33: ordinal not in

一下午的时间一直在解决这个错误……最后发现一个函数参数就可以解决😔

事情起因是在使用文件的 write 函数将数据集中的字符串数据写入文件时报错如下:

UnicodeEncodeError: ‘ascii’ codec can’t encode character ‘\u2019’ in position 31: ordinal not in range (128)

之后通过以下一系列操作把编码换成 ‘utf-8’

import sys
import codecs
sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())

import sys
import importlib
importlib.reload(sys)
export LANG="en_US.UTF-8"

又报错:

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 31-33: ordinal not in range(128)

搜索发现可能是中文标点的问题,于是又在程序中添加如下语句:

import os
os.environ['NLS_LANG'] = 'AMERICAN_AMERICA.AL32UTF8'
os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'

然后新的错误接踵而至:

UnicodeDecodeError: ‘unicodeescape’ codec can’t decode byte 0x5c in position 27: \ at end of string

检查数据发现字符串中有 ”:\\“ 包含转义字符,所以就报错了,然后参考博客对字符串变量的非转义操作函数repr()使用repr()函数对字符串变量去掉转义,发现可以了……

尝试了好几种方法其实不太确定是哪一种方法奏效,最后经测试发现,其实一开始只要在文件的open()函数中添加 encoding=‘utf-8’ 这一参数就足够了,把其他的添加的编解码代码去掉也丝毫不影响……所以这些方法大家都可以尝试一下~

写文件的时候一定要注意编解码格式为 utf-8 !!!


2023.02.20 更新

刚刚发现下面代码也可以成功解决该问题:

在终端使用命令python进入 Python IDE,通过下述程序查看环境变量:

import sys
print(str(sys.stdout.encoding))

如果print出的结果不是‘utf-8’ (比如我的是 ‘ANSI_X3.4-1968’),则使用下述命令修改环境变量:

export PYTHONIOENCODING=utf-8

修改之后再运行原来的程序就不会报错啦~


参考资料

  1. 终极解决方案UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\uff08’ in position 13: ordinal not
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
UnicodeEncodeError是一个常见的编码错误,它表示在将Unicode字符编码为指定编码格式(如ASCII出现问题。这个错误通常发生在尝试将非ASCII字符(如中文、日文、韩文等)编码为ASCII字符解决这个错误的方法是使用正确的编码格式来处理非ASCII字符。以下是一些可能的解决方法: 1. 使用正确的编码格式进行编码:在处理非ASCII字符,确保使用正确的编码格式进行编码。例如,在Python中,可以使用`encode()`方法将字符串编码为指定的编码格式。例如,将字符串编码为UTF-8格式:`string.encode('utf-8')`。 2. 设置默认编码格式:在某些情况下,可以通过设置默认编码格式来解决编码问题。在Python中,可以使用`sys.setdefaultencoding()`方法来设置默认编码格式。但是需要注意的是,这种方法并不推荐使用,因为它可能会引起其他问题。 3. 使用合适的编码格式进行文件操作:如果在处理文件出现编码错误,可以使用适当的编码格式打开文件。例如,在Python中,可以使用`open()`函数的`encoding`参数指定文件的编码格式。例如:`open('file.txt', encoding='utf-8')`。 4. 使用合适的编码格式进行网络请求:如果在进行网络请求出现编码错误,可以使用适当的编码格式来处理响应数据。例如,在Python中,可以使用`requests`库发送网络请求,并使用`response.encoding`属性来指定响应数据的编码格式。例如:`response.encoding = 'utf-8'`。 请注意,具体的解决方法取决于你所使用的编程语言和环境。以上提供的方法是一些常见的解决方案,但可能需要根据具体情况进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_Meilinger_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值