问题
直接使用以下代码获取内容
import requests
url = "你的url"
response = requests.get(url)
print(response.text)
结果中文是乱码的如下
解决
我们将其编码设置为utf8
万国码即可,代码如下
import requests
url = "你的url"
response = requests.get(url)
response.encoding = "utf-8"
print(response.text)
此时是因为我们自己人为的进行判别页面的编码为utf8
,所以才可以解决。但如果页面的编码为gbk
呢?我们又需要指定为gbk
。实际上,我们有一个更智能的方法可以解决该问题,就是直接通过代码去获取当前页面的编码即可,代码如下:
import requests
url = "你的url"
response = requests.get(url)
response.encoding = response.apparent_encoding
print(response.text)