今天在学写python爬虫时,爬取URL源码转码(decode)时总是报错:'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte。后经http://blog.csdn.net/zhanghaipeng1989/article/details/41117887点击打开链接提醒,将header中的 'Accept-Encoding':' gzip, deflate'去掉,问题得到了解决。至于是什么原因,还要等我继续学习寻找。如果有恰巧知道原理的大神有缘看到这里,希望不吝赐教。
附:
原来header:HEADER = {'':'',..., 'Accept-Encoding':' gzip, deflate','':''...},后来将显示部分去掉重写header,问题得到解决。