记一个遇到的requests库编码的小问题

最新推荐文章于 2024-05-01 06:26:34 发布

xinyiatcsdn

最新推荐文章于 2024-05-01 06:26:34 发布

阅读量143

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinyiatcsdn/article/details/93543047

版权

今天刚开始看MOOC的爬虫课程，在开头看见老师给的通用爬虫框架有这么一句
r=requests.get(url)
r.encoding=r.apparent_enconding
return r.text

这里其实是存在2个问题的：

requests库的content与text
这个是开课8老师提过的
content返回类型是str
text返回类型是Unicode，所以需要指定一下编码形式，不然容易显示乱码
还说了啥忘记了，反正他的结论是建议用content.decode()
关于这个decode，MAC系统默认是utf-8，Windows默认gbk，所以Windows有时需要根据网页的编码指定encoding=“utf-8”
将r的内容用with open保存到txt文件时的编码问题
用with open保存到txt文件时，光在content里面decode了还不一定ok，我Windows系统遇到了一个这样的问题：
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xbb’ in position 30633: illegal multibyte sequence
或者UnicodeEncodeError: ‘gbk’ codec can’t encode character '\xa0’错误
查询之后的解决办法：
（1）在with open里加encoding=‘utf-8’，
（2）content不加decode然后保存的时候直接保存二进制字节wb

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
记一个遇到的requests库编码的小问题

今天刚开始看MOOC的爬虫课程，在开头看见老师给的通用爬虫框架有这么一句r=requests.get(url)r.encoding=r.apparent_encondingreturn r.text这里其实是存在2个问题的：requests库的content与text这个是开课8老师提过的content返回类型是strtext返回类型是Unicode，所以需要指定一下编码形式，不...
复制链接

扫一扫

xinyiatcsdn CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

53万+: 周排名

205万+: 总排名

1万+: 访问

: 等级

113: 积分

15: 粉丝

7: 获赞

15: 评论

31: 收藏

私信

关注

热门文章

分类专栏

运维 1篇
爬虫 4篇
开发 3篇

最新评论

统信UOS安装Anaconda使用jupyternotebook
you_you__: 麻烦问一下这个问题有解决办法吗
统信UOS安装Anaconda使用jupyternotebook
dayboy553: 报错如下： Anaconda3-2022.05-Linux-x86_64.sh:行407: /home/rjxybj/anaconda3/conda.exe：无法执行二进制文件: 可执行文件格式错误 Anaconda3-2022.05-Linux-x86_64.sh:行409: /home/rjxybj/anaconda3/conda.exe：无法执行二进制文件: 可执行文件格式错误 file得到的提示如下： Anaconda3-2022.05-Linux-x86_64.sh: POSIX shell script executable (binary data) 哥，有时间能看一下么
统信UOS安装Anaconda使用jupyternotebook
2301_79975636: pip指定pip3以后，pip install就不生效了，换pip3才行
统信UOS使用Spyder兼解决离线安装包问题
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题很吸引人，特别是讲解了如何在统信UOS上使用Spyder并解决离线安装包问题，这对于许多使用这个操作系统的读者来说一定非常实用。您的经验分享给了大家很好的指导，感谢您的辛勤付出。在下一步的创作中，或许可以考虑扩展一下主题，比如介绍一些常见的问题和解决方案，或者分享一些实用的技巧和优化建议。当然，这只是一些建议，希望能对您有所启发。期待您继续分享更多有价值的内容，谢谢您的努力！
使用统信UOS第一天，就把系统搞崩了
xinyiatcsdn: 问题解决了没换啊

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。