python3出现utf-8 codec cant decode bytes in position114-115:invalid continuation byte怎么办
首先检查文件编码是不是utf-8;
如utf-8,检查是否有乱码。
这个错误说这两个字节的内容无法按utf-8来解码。
比如一些网站页面有部分乱码的问题存在,去掉相应的字节后就好,我是这么解决的:def _html(url, decode):
html = urlopen(url).read()
if not decode:
decode = _testencode(html)
while True:
try:
html = html.decode(decode)
break
except (UnicodeDecodeError,) as e:
html = html[:e.args[2]-1] html[e.args[3] 1:]
return html
这里except 块里动作就是把相应不能解码的内容丢弃。对应文本文件也可以用类似的方法处理。
python3的print怎么输出utf8
utf8stdout = open(1, 'w', encoding='utf-8', closefd=False) # fd 1 is stdoutprint(str, file=utf8stdout)貌样可以,有没有更方便的办法
版权声明:本站所有文章皆为原创,欢迎转载或转发,请保留网站地址和作者信息。