解决response.text获取中文乱码问题

最新推荐文章于 2023-10-11 12:14:51 发布

老Amy

最新推荐文章于 2023-10-11 12:14:51 发布

阅读量5.4k

点赞数 6

分类专栏：少女的错误集

本文链接：https://blog.csdn.net/weixin_44352981/article/details/109358879

版权

16 篇文章 10 订阅

订阅专栏

直接使用以下代码获取内容

import requests
url = "你的url"
response = requests.get(url)
print(response.text)

结果中文是乱码的如下
在这里插入图片描述

我们将其编码设置为utf8万国码即可，代码如下

import requests
url = "你的url"
response = requests.get(url)
response.encoding = "utf-8"
print(response.text)

在这里插入图片描述
此时是因为我们自己人为的进行判别页面的编码为utf8，所以才可以解决。但如果页面的编码为gbk呢？我们又需要指定为gbk。实际上，我们有一个更智能的方法可以解决该问题，就是直接通过代码去获取当前页面的编码即可，代码如下：

import requests
url = "你的url"
response = requests.get(url)
response.encoding = response.apparent_encoding
print(response.text)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注