Python抓取数据乱码b'\x1f\x8b\x08\x00\x00\x00\x00\x0....[UnicodeDecodeError]

最新推荐文章于 2024-09-13 21:26:23 发布

Aaron2333

最新推荐文章于 2024-09-13 21:26:23 发布

阅读量1w

点赞数 1

分类专栏： Python 文章标签： Python UnicodeDecodeError gzip

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Aaron2333/article/details/89376882

版权

Python 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

引入gzip

from urllib import request
import gzip

    r = request.urlopen(url)
    content = r.read()
    
    # 错误！ --> UnicodeDecodeError: 
    # 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
    # encoded_content = str(content, encoding='utf-8')
    
    # 正解 √
    encoded_content = gzip.decompress(content).decode("utf-8")

引起乱码的原因是因为目标网站，在HTTP协议中配置了Content-Encoding 字段，这个字段可以改变数据的压缩方法。

以下是目标网站，请求头的截图
在这里插入图片描述

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Aaron2333 CSDN认证博客专家 CSDN认证企业博客

码龄8年

30: 原创

11万+: 周排名

91万+: 总排名

3万+: 访问

: 等级

627: 积分

7: 粉丝

18: 获赞

12: 评论

91: 收藏

私信

关注

热门文章

分类专栏

Deep Learning 5篇
面试 10篇
基础算法 10篇
Tensorflow 2篇
CNN 2篇
踩坑 3篇
Pyqt5 1篇
Pyspark 1篇
RDD 1篇
Redis
KafKa 1篇
Python 20篇
Shadosocks
Mysql 2篇
Django 4篇

最新评论

Python抓取数据乱码b'\x1f\x8b\x08\x00\x00\x00\x00\x0....[UnicodeDecodeError]
wgj200318: 这样还不行的原因是你爬的网站有反爬虫保护，这个网站检测到同一个IP的快速大量访问时会给你的IP地址拉黑，需要写一个动态IP池，每次爬的时候换一个随机IP，就不会有问题了
深度学习玩LOL-游戏助手-概述
学不来我就死: 您好，可以发给我源代码嘛，您git上的代码好像缺失了部分
Django2 media文件访问配置
Tisfy: 总结得十分精辟，就像那：六翮飘飖私自怜，一离京洛十馀年。
[Python3]为什么map比for循环快
凉雪飞: 数据集100W-1WW 依然呈现这个趋势。 n = 10000 N = 10000 t = timeit.timeit(f'",".join(map(str,range({n})))',number=N) t1 = timeit.timeit(f'",".join([str(i) for i in range({n})])',number=N) t2 = timeit.timeit(f'",".join(str(i) for i in range({n}))',number=N) print("map",t) print("list",t1) print("for",t2) map 17.2202679 list 18.741682299999997 for 24.052492100000002[code=plain] [/code][code=python] [/code][code=python] [/code][code=python] [/code]
深度学习玩LOL-游戏助手-概述
Aaron2333: 哈哈你不会真的要用吧这只是一个课的作业而已。就是图个乐况且要更新装备图片了，这会导致装备识别错误的。

大家在看

【力扣283+189】移动零、轮转数组（非官方思路）

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。