【爬虫篇】“UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 52988“ 异常的解决方法

最新推荐文章于 2024-03-15 21:46:35 发布

VIP文章 1024码字猿

最新推荐文章于 2024-03-15 21:46:35 发布

阅读量3.2k

点赞数 1

文章标签：爬虫 python chrome

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40458518/article/details/122642698

版权

爬取网站时，有的网站，进行“utf-8”解码时，报错。

注意：网站是utf-8编码没有错，不是gbk之类的其它编码。网站的实际编码可以通过浏览器的开发者工具（F12键）中的Console的浏览器控制平台输入如下代码，可以查看。
在这里插入图片描述

document.charset   # 'UTF-8'

代码1：报错

from urllib.request import urlopen

res = urlopen('https://www.chinanews.com.cn/china/')
print(res.read().decode('utf-8')) # 报错

运行结果：是报错的

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 52988: invalid continuation byte

代码1的解决方法：decode(‘utf-8’,‘ignore’)

from urllib.request import urlopen

re

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【爬虫篇】“UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 52988“ 异常的解决方法

爬取网站时，有的网站，进行“utf-8”解码时，报错。注意：网站是utf-8编码没有错，不是gbk之类的其它编码。网站的实际编码可以通过浏览器的开发者工具（F12键）中的Console的浏览器控制平台输入如下代码，可以查看。document.charset # 'UTF-8'代码1：报错from urllib.request import urlopenres = urlopen('https://www.chinanews.com.cn/china/')print(res.read(
复制链接

扫一扫

1024码字猿 CSDN认证博客专家 CSDN认证企业博客

码龄7年

41: 原创

10万+: 周排名

205万+: 总排名

11万+: 访问

: 等级

513: 积分

46: 粉丝

90: 获赞

8: 评论

575: 收藏

私信

关注

热门文章

分类专栏

最新评论

【转载】爬虫篇——urllib3的基础知识（总结）
Sea Bean: Turing Testing.... Not Human definitely!
【转载】爬虫篇——urllib3的基础知识（总结）
CSDN-Ada助手: 非常感谢您转载了这篇关于urllib3的基础知识总结的技术文章。我觉得您可以继续写有关网络爬虫的主题，比如说"Python爬虫系列之urllib库的详细使用"，这样的技术文章对其他用户学习爬虫知识也会有很大帮助。相信您的博客会拥有更多读者的关注和支持。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
在Pycharm中,输入print打印的小技巧
墨竹之味: 请问我想自己设置一个 .print 模板，应在上面地方设置
【爬虫篇】根据网站的robots.txt文件判断一个爬虫是否有权限爬取这个网页
风隼: 这个不好，robots中的* ？都被转义了。判断不准
【转载】爬虫篇——httpx的基础知识（总结）
十年磨一剑-----: httpx 和 http 包有什么区别？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。