许多小伙伴在python爬虫中遇到中文乱码的问题。。
都以为是编码错误,其实真正的原因是文件被压缩了。。直接上代码
#加上红色这段代码就ok!!!import zlib import urllib2 import sys typeEncode = sys.getfilesystemencoding() request = urllib2.Request("http://www.baidu.com") response = urllib2.urlopen(request) data = response.read() decompress_data = zlib.decompress(data,16+zlib.MAX_WBITS) print decompress_data