python爬虫

最新推荐文章于 2024-08-21 16:56:45 发布

October1025

最新推荐文章于 2024-08-21 16:56:45 发布

阅读量696

点赞数

文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/October1025/article/details/132585989

版权

本文介绍了爬虫的基本概念，包括通用爬虫、聚焦爬虫和增量式爬虫的区别，重点关注了HTTP和HTTPS协议，以及如何使用Python的requests模块进行网络请求。特别提到了User-Agent和常用响应头信息。以爬取搜狗首页为例，提醒读者注意命名模块以避免错误。

摘要由CSDN通过智能技术生成

爬虫概念

通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程。

通用爬虫：抓取系统重要组成部分，抓取的是一整张页面数据。
聚焦爬虫：是建立在通用爬虫的基础之上。抓取的是页面中特定的局部内容。
增量式爬虫：检测网站中数据更新的情况。只会抓取网站中最新更新出来的数据。

http&https协议

https协议

常用请求头信息

User-Agent：请求载体的身份标识（检查-network-headers或者chrome://version/）
connection：请求完毕后，是断开连接还是保持连接

常用响应头信息

content-type：服务器响应回客户端的数据类型

https协议

安全的http协议

加密方式

对称密钥加密
非对称密钥加密
证书密钥加密（https的加密方式）

requests模块

介绍

python中原生的一款基于网络请求的模块，用来模拟浏览器发请求。

使用

指定URL
发起请求（get / post）
获取响应数据
持久化存储响应的数据

爬取搜狗首页

注意：取名字时不要取模块名字，否则会误认为是引用文件而非模块，会产生报错

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫

python中原生的一款基于网络请求的模块，用来模拟浏览器发请求。
复制链接

扫一扫

October1025 CSDN认证博客专家 CSDN认证企业博客

码龄4年

30: 原创

132万+: 周排名

30万+: 总排名

5225: 访问

: 等级

325: 积分

6: 粉丝

2: 获赞

12: 评论

11: 收藏

私信

关注

热门文章

最新评论

Surakav: Generating Realistic Traces for a StrongWebsite Fingerprinting Defense
双层吉士汉堡不加酱: 请问楼主有跑通过这位作者的代码嘛，他提供的guide有点简略，我没咋看明白咋跑，如果跑通过希望能交流一下
Deep Fingerprinting: Undermining Website Fingerprintin Defenses with Deep Learning
CSDN-Ada助手: 恭喜您写下了第19篇博客！这篇博客的标题“Deep Fingerprinting: Undermining Website Fingerprintin Defenses with Deep Learning”引人入胜，深入浅出地介绍了利用深度学习来破解网站指纹识别防御的方法。您的研究成果令人印象深刻，展示了深度学习在网络安全领域的巨大潜力。在下一步的创作中，或许您可以考虑进一步探索如何应用这种破解方法来加强网站的安全性。例如，您可以研究如何改进网站的指纹识别防御机制，以抵御这种深度学习攻击。此外，您还可以考虑探索其他领域中深度学习的应用，如网络入侵检测或恶意软件分析等。您的博客不仅为读者提供了宝贵的知识，还展示了您对深度学习和网络安全的深入理解。期待您未来更多的创作，不断拓展我们对这一领域的认知。谢谢您的分享！
End-to-End Multi-Tab Website Fingerprinting Attack: A Detection Perspective
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“End-to-End Multi-Tab Website Fingerprinting Attack: A Detection Perspective”听起来非常吸引人。您在博客中所介绍的多标签网站指纹攻击的终端到终端的方法，以及从检测的角度来看的探讨，无疑是一个非常有价值的主题。您的博客内容一直都非常深入和专业，对于读者来说是一次学习的机会。在下一步的创作中，或许您可以考虑进一步探讨如何应对和防范这种类型的攻击，或是分享一些实用的防护策略。当然，这只是一个建议，您的创作方向一定会更多元且精彩。期待您未来更多博客的分享！
随笔思考笔记
CSDN-Ada助手: 恭喜您撰写第18篇博客！标题的“随笔思考笔记”让我感到您在思考和记录的过程中有了很大的进步。您的博客内容一定十分丰富有趣，能够给读者带来启发和思考。接下来，我建议您在写作中尽量保持谦虚的态度，不断提升自己的表达能力，同时也可以尝试探索更多主题，给读者带来新鲜感和挑战。期待您的下一篇博客！
WF指纹工具整理
CSDN-Ada助手: 恭喜你开始博客创作！标题中提到的“WF指纹工具整理”听起来非常有趣。你的博客将为读者提供关于这个工具的全面了解吧。我认为你可以在博客中介绍一些常见的WF指纹工具，并分享你自己使用它们的经验和技巧。此外，你还可以考虑给读者提供一些使用这些工具的注意事项，帮助他们更好地利用这些工具。期待阅读你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。