原文地址:http://www.maiziedu.com/article/24347/
环境python2:
问题:r=reponse.read() 为乱码;
解决办法:对于r=reponse.read() 返回的内容使用r=r.decode('utf-8') 和r=r.decode('GB2312')都无效时,乱码应该不是由编码造成的,而是由压缩格式(以gzip压缩格式输出页面);
添加以下两个库
import gzip import StringIO
对于 r=reponse.read()进行处理为:
data = StringIO.StringIO(r)
gzipper = gzip.GzipFile(fileobj=data)
html = gzipper.read()
然后print就正常了。