关于requests.get(url)" ´óÊý¾ÝÍÚ¾ò¹¤³ÌÊ£¨Ò½ÁÆ½¡¿µ·½Ïò£©"

最新推荐文章于 2024-08-06 09:49:30 发布

ZwY*

最新推荐文章于 2024-08-06 09:49:30 发布

阅读量2.3k

点赞数

分类专栏： python爬虫

本文链接：https://blog.csdn.net/qq_40821402/article/details/90727780

版权

python爬虫专栏收录该内容

12 篇文章 1 订阅

订阅专栏

在写爬虫的时候发现requests(url)之后得到的responses.text,这里的中文都是" ´óÊý¾ÝÍÚ¾ò¹¤³ÌÊ£¨Ò½ÁÆ½¡¿µ·½Ïò£©"这种乱码，懵了，之前没见过百度也没百度到，最后看到网上的一个方法，说把responses转化一下转成gbk编码的，然后试了一下中文就出来了，不知道有没有小伙伴跟我遇到同样的问题。

主要原因在于解码时候用的是utf-8，但是这个网页的编码是gbk的，刚开始没注意到，因为在编码的时候对于汉字gbk一个字符占两个字节，而utf-8一个汉字字符占三个字节，这样一来如果编码与解码的方式不同自然显示出来的东西就不同了

response = requests.get(url)
response.encoding = 'gbk'
html = response.text

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZwY*

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于requests.get(url)" ´óÊý¾ÝÍÚ¾ò¹¤³ÌÊ£¨Ò½ÁÆ½¡¿µ·½Ïò£©"

在写爬虫的时候发现requests(url)之后得到的responses.text,这里的中文都是" ´óÊý¾ÝÍÚ¾ò¹¤³ÌÊ£¨Ò½ÁÆ½¡¿µ·½Ïò£©"这种乱码，懵了，之前没见过百度也没百度到，最后看到网上的一个方法，说把responses转化一下转成gbk编码的，然后试了一下中文就出来了，不知道有没有小伙伴跟我遇到同样的问题。主要原因在于解码时候用的是utf-8，但是这个网页的...
复制链接

扫一扫