python gzip 字符串压缩_python处理经过gzip压缩的网页内容

最新推荐文章于 2023-07-10 16:03:14 发布

weixin_39912163

最新推荐文章于 2023-07-10 16:03:14 发布

阅读量936

点赞数

文章标签： python gzip 字符串压缩

Python在进行网页抓取时，有时会获取到经过gzip压缩后的数据(体积小，传输快)，导致无法阅读和使用。

如图所示，为http原始报文。可以看到，header区域的“Content-Encoding: gzip”标明了正文是经过gzip压缩后的数据，而body区域蓝色框里面的数据即是gzip的数据源(至于body区域其它额外的字符，可能是一些辅助标记，这里不做关心)。

至于为什么我们从浏览器打开网页时是可读的文字，是因为浏览器自动帮我们进行了解压。

那么，如何通过编程方式进行gzip解压呢？幸运的是，python标准库zlib自带了gzip格式的解压相关函数。

如下图所示，通过python自带的zlib包，即可完成对压缩数据的解压。

至于最后的那个参数为何是“zlib.MAX_WBITS+16”，是因为zlib不是单纯用来处理gzip的，gzip的数据格式决定了要使用这个值；也就是说如果zlib处理其它的压缩格式，这个值就会变化。

参考下文：

weixin_39912163

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。