利用Requests模块获取到目标页面后,先观察该页面的编码:
req = requests.request('GET', url)
print req.encoding
当这个编码与你的IDE的编码相同的时候,才不会乱码。
一般文件都是utf8的格式。
我的PyCharm是encoding设置的是utf8格式,所以当我请求百度首页后,返回的页面可以直接通过req.text显示,无乱码。
而我然后又请求了一个页面,该页面的encoding是ISO-8859-1的,所以显示乱码,这时候要使得页面的编码符合你IDE的编码格式,所以修改页面的编码为utf-8才能不乱码:
req.encoding='utf-8'
然后再:
print req.text
才不是乱码。