python3 'utf-8' codec can't decode byte 0xb3

最新推荐文章于 2024-03-18 20:09:04 发布

shengnan_only

最新推荐文章于 2024-03-18 20:09:04 发布

阅读量4.4k

点赞数

分类专栏：测试开发文章标签： python解码

本文链接：https://blog.csdn.net/zhengshengnan123/article/details/82892450

版权

测试开发专栏收录该内容

39 篇文章 0 订阅

订阅专栏

问题：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 109: invalid start byte

该问题发生于decode解码；

编码与解码：

编码就是将字符串转换成字节码，涉及到字符串的内部表示。
解码就是将字节码转换为字符串，将比特位显示成字符。

decode()方法语法：

bytes.decode(encoding="utf-8", errors="strict")

encoding -- 要使用的编码，如"UTF-8"。
errors -- 设置不同错误的处理方案。默认为 'strict',意为编码错误引起一个UnicodeError。其他可能得值有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 以及通过 codecs.register_error() 注册的任何值。

python3实例：

#!/usr/bin/python3

str = "菜鸟教程";

str_utf8 = str.encode("UTF-8")

str_gbk = str.encode("GBK")

print(str)

print("UTF-8 编码：", str_utf8)

print("GBK 编码：", str_gbk)

print("UTF-8 解码：", str_utf8.decode('UTF-8','strict'))

print("GBK 解码：", str_gbk.decode('GBK','strict'))

实例结果：

        菜鸟教程
        UTF-8 编码： b'\xe8\x8f\x9c\xe9\xb8\x9f\xe6\x95\x99\xe7\xa8\x8b'
        GBK 编码： b'\xb2\xcb\xc4\xf1\xbd\xcc\xb3\xcc'
        UTF-8 解码： 菜鸟教程
        GBK 解码： 菜鸟教程

文章初始抛出的问题，可能是解码时的type不正确：

我的具体实践是：page = request.urlopen(req).read()

rencode = page.decode('utf-8')

抛出上面的问题；

解决：将解码type改为gbk，即rencode = page.decode('gbk')，问题得以解决。

shengnan_only

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python3 'utf-8' codec can't decode byte 0xb3

问题：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 109: invalid start byte该问题发生于decode解码；编码与解码：编码就是将字符串转换成字节码，涉及到字符串的内部表示。解码就是将字节码转换为字符串，将比特位显示成字符。decode()方法语法...
复制链接

扫一扫