网页爬取中文数据时乱码

最新推荐文章于 2024-01-25 11:56:25 发布

九月一。

最新推荐文章于 2024-01-25 11:56:25 发布

阅读量336

点赞数

文章标签： python java 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73500273/article/details/130446920

版权

今天在爬取一个网页时，发现什么都是好的，就是中文乱码。查看网上好所让把编码改为utf-8，但是还是不行，后来灵光一闪，发现网页源码上有一个charset=gbk，想着试试gbk这个编码，发现可以。。。。。恶心，这反爬无所不用其极。。。。

这是代码

import requests
from lxml import etree
import os
url ="https://www.biqooge.com/"
resp= requests.get(url)
print(resp.text)

运行后发现，中文的地方会乱码

类似于这样：

添加了编码后还是没变换，后来试了一下gbk（他网页源码上的编码格式）发现可以

import requests
from lxml import etree
import os
url ="https://www.biqooge.com/"
resp= requests.get(url)
resp.encoding="gbk"
print(resp.text)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
网页爬取中文数据时乱码

今天在爬取一个网页时，发现什么都是好的，就是中文乱码。查看网上好所让把编码改为utf-8，但是还是不行，后来灵光一闪，发现网页源码上有一个charset=gbk，想着试试gbk这个编码，发现可以。恶心，这反爬无所不用其极。添加了编码后还是没变换，后来试了一下gbk（他网页源码上的编码格式）发现可以。运行后发现，中文的地方会乱码。
复制链接

扫一扫

九月一。 CSDN认证博客专家 CSDN认证企业博客

码龄2年

8: 原创

170万+: 周排名

176万+: 总排名

1412: 访问

: 等级

89: 积分

1: 粉丝

0: 获赞

7: 评论

0: 收藏

私信

关注

热门文章

最新评论

ctfshow sql注入系列1
CSDN-Ada助手: 恭喜你写了第7篇博客！看了你的标题《ctfshow sql注入系列》，真是让人期待不已。你一直坚持不懈地分享有关SQL注入的知识，这是非常值得赞赏的。在这个系列中，你已经涉及了很多有趣的话题，我真的很期待你接下来会写些什么。如果我可以提一个创作建议的话，希望你能够在将来的文章中更加深入地探讨SQL注入的技术细节，或者分享一些你在实践中遇到的具体案例。这样的话，读者们可以更好地理解和应用你所传授的知识。当然，我知道这些建议只是我的个人想法，你的创作方向完全取决于你自己。期待你的下一篇作品！
ctfshow sql注入系列2
CSDN-Ada助手: 恭喜您写下了第8篇博客！阅读您的博客《ctfshow sql注入系列2》让我感到非常兴奋。您在SQL注入领域的深入探索非常令人钦佩。在下一步的创作中，我建议您可以继续扩展这个系列，探讨一些更深入、更复杂的SQL注入技术。或者，您可以考虑分享一些实际案例，讲述您在解决SQL注入问题时的思考过程和应对策略，这将对读者来说非常有价值。谦虚地说，我相信您的博客将继续为读者提供有用的信息和启发。期待看到更多精彩的内容！加油！
ctfshow,命令执行系列
CSDN-Ada助手: 恭喜您写出了第5篇非常有趣的博客！您的命令执行系列真的是非常有价值的，我在阅读后收获了很多。接下来，我希望您可以更深入地探讨命令执行的相关问题，或者分享一些实战经验，这样更能帮助我们更好地理解和应用。再次感谢您的分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
有关selenium定位框架出错
CSDN-Ada助手: 恭喜您写出了第三篇博客，标题看起来非常有趣。我很期待能够阅读您的文章，并从中学到更多关于selenium定位框架的知识。建议您可以在下一篇博客中分享一些解决这个问题的经验和技巧，这对于其他遇到相似问题的读者来说将会非常有用。继续加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
qq邮箱自动发送
CSDN-Ada助手: 恭喜您写了第四篇博客！关于qq邮箱自动发送的主题，非常实用，很多人都会受益于此。希望您能继续坚持创作，分享更多的实用技巧和经验。下一步的建议是可以尝试分享一些个人心得体会，或者是分享一些行业内的最新动态，让读者们更加深入了解相关的领域。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九月一。 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。