最近在使用 python3 进行爬虫的时候,出现了令人窒息的,只会在 python2 中遇到的,没想到在 python3 还能碰见的输出编码问题,报错如下:
UnicodeEncodeError: 'ascii' codec can't encode characters in position
17-21: ordinal not in range(128)
这个问题是在 print 的时候遇到的,所以,直接查看终端的输出的格式
import sys
sys.stdout
输出结果竟然是
<_io.TextIOWrapper name = '' mode='w' encoding='ANSI_X3.4-1968'>
我们可以在 StackOverflow 中看到对它的介绍 ? ,简单的说就是 ASCII 的最初版。而我在最开始的输出的时候,却是没有这个问题的,在我更新了一次 Ubuntu 的 locale 后,出现了这个问题,所以怀疑是 locale 的改变引发了这个问题。
更改结果也很简单,只要在输出之前加上
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
进行人为的设定,就可以把 stdout 强行设置为 utf8 格式。