以下是设置requests库中get方法如何改变response内容的编码格式,使其能正常显示中文内容,而不出现乱码。
import requests #导入Python requests库
url = 'https://www.baidu.com' #设置访问资源为百度https://www.baidu.com
r = requests.get(url) #向百度发送给请求,r为response实例,即百度网页的HTML页面内容
print("页面默认编码格式:%s" % r.encoding) #查看页面编码格式
print("get返回HTML页面内容:%s" % r.text) #查看返回内容
print("状态码:%s" % r.status_code) #打印请求状态码,200即表示请求成功
r.encoding = "utf-8" #设置页面内容以UTF-8编码格式返回
print("修改之后的编码格式:%s" % r.encoding)
print("get返回HTML页面内容:%s" % r.text)
print("状态码:%s" % r.status_code)
两次输出内容的对比,由图可以看出第一次编码格式为ISO-8859-1,打印出的页面内容有出现乱码;
第二次打印出来的编码格式已经更改为UTF-8,并成功显示中文。