python之编码集判断-chardet库

糖糖糖果88

已于 2024-01-04 16:20:26 修改

阅读量685

点赞数 6

文章标签： python

于 2024-01-04 16:19:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_59329828/article/details/135389645

版权

不同网页可能使用的是不一样的网页编码，有的是gb2312，有的又可能是UTF-8.

当编码集使用错误，会出现乱码的情况

如何判断呢？

例如；这里是并发爬虫时做判断

async with session.get(self.url.format(page),headers=self.headers) as response:

当我们通过爬取内容后，得到response时，

content =await response.read()

content接收读取结果，然后得到其中的编码集类型

encoding = chardet.detect(content)['encoding']

再进行编码集的判断，当不是我们需要的编码集时，可以做不同处理

if encoding=='GB2312'or encoding=='ISO-8859-1':

        result=content.decode('gbk')

else:

        result = content.decode(encoding)

        print('被反爬了...')

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
python之编码集判断-chardet库

不同网页可能使用的是不一样的网页编码，有的是gbk，有的是gb2312，有的又可能是UTF-8.再进行编码集的判断，当不是我们需要的编码集时，可以做不同处理。content接收读取结果，然后得到其中的编码集类型。print('被反爬了...')当我们通过爬取内容后，得到response时，当编码集使用错误，会出现乱码的情况。这里是并发爬虫时做判断。
复制链接

扫一扫

博客等级

码龄3年

36
原创

488
点赞

475
收藏

343
粉丝

关注

私信

热门文章

分类专栏

vue 1篇
jQuery 16篇
ajax 2篇

最新评论

jQuery鼠标事件、键盘事件、浏览器事件
CSDN-Ada助手: 亲爱的博主，恭喜你发布了第19篇博客！你对jQuery鼠标事件、键盘事件、浏览器事件的讲解非常详细，让我收获颇丰。希望你能继续保持创作的热情，不断分享你的知识和经验。或许下一步可以考虑写一些实战案例，让读者更容易理解和运用所学的知识。期待你的下一篇作品！
jQuery 语法知识（子元素过滤、内容过滤选择器）
CSDN-Ada助手: 恭喜您写了第16篇博客！标题《jQuery 语法知识（子元素过滤、内容过滤选择器）》听起来非常有趣和富有挑战。您的持续创作精神令人钦佩！我真的很喜欢您对jQuery语法的深入研究，并且标题中的子元素过滤和内容过滤选择器似乎会给读者带来很多有益的信息。鉴于您在这个领域的专业知识，我想建议您在下一篇博客中探讨一些实际应用场景，例如如何在网页中使用这些过滤选择器来提高用户体验。或者，您还可以分享一些最佳实践，帮助我们更好地理解如何有效地使用这些语法知识。请继续保持谦虚，我期待着您的下一篇博客！再次恭喜您的持续创作！
jQuery语法知识（表单）
CSDN-Ada助手: 恭喜你撰写了这篇关于jQuery语法知识（表单）的博客！你对这个主题的理解很深刻，写得非常清晰易懂。希望你能继续保持创作的热情，分享更多关于jQuery的知识。或许你可以考虑写一些实际案例，让读者更直观地了解如何运用jQuery解决实际问题。期待你的下一篇作品！
jQuery语法知识（层级选择器及可见性过滤）
CSDN-Ada助手: 恭喜您写了第18篇博客，标题为“jQuery语法知识（层级选择器及可见性过滤）”！您的持续创作令人钦佩，对于jQuery语法的深入探讨让我们受益良多。希望您能继续分享关于jQuery的知识，或许可以考虑写一些实际案例或者应用场景的分析，让我们更好地理解和运用这些知识。期待您的下一篇作品！
jQuery 语法知识
CSDN-Ada助手: 恭喜您写了第15篇博客！标题中的“jQuery 语法知识”让我非常期待阅读您的分享。您对于jQuery的掌握程度显然非常深入，这将为读者提供宝贵的学习资源。不过，或许在未来的创作中，您可以考虑将核心的语法知识与实际应用场景相结合，这样可以更好地帮助读者理解如何将jQuery应用到实际项目中。期待您在未来更多的博客中分享更多有关jQuery的实践经验和案例！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。