Diary04-Python网络爬虫-Requests库及实战示例

憨憨不怕输

已于 2023-11-23 23:45:31 修改

阅读量409

点赞数 12

文章标签： python 爬虫开发语言

于 2023-11-23 23:39:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sxc010701/article/details/134588593

版权

Python网络爬虫-Requests库及实战示例

1.Requests库

1.1Requests库的7个主要方法：

1.1.1requests.get()

1.1.2Response

其中Response对象的属性有以下5种：

通过r.status_code返回http请求状态，当输出为200时可以进行Response其他4个属性的输入；当输出为404(非200时)，表示由某些原因出错产生异常，以下以图解形式呈现：

下面为Response编码解析：

1.2爬取网页的通用代码框架

1.2.1Requests库异常

1.2.2爬取网页的通用代码框架

下面代码框架中try‐except是进行异常处理；

1.3 http协议以及对网络资源的操作

1.3.1http协议是什么

1.3.2http协议对资源的操作

http协议对资源的操作：

理解patch与put的区别，以下给出一个例子：

2.网络爬虫爬取原则

2.1网络爬虫的尺寸

2.2网络爬虫的限制

来源审查：User‐Agent

检查来访HTTP协议头的User‐Agent域，只响应浏览器或友好爬虫的访问
发布公告：Robots协议

告知所有爬虫网站的爬取策略，要求爬虫遵守

3.Requests库网络爬取实战

3.1京东商品页面的爬取

以下为代码示例：

3.2亚马逊商品商品的爬取

这里User-Agent会检测出来python requests库从而禁止爬取，所以要修改http协议头，下面为代码示例：

3.3百度搜索关键词提交

我们先了解百度关键词接口构成：

由此我们只需要指定wd指向的keyword，keyword及我们想要查询的关键词，程序运行结束后会有url链接，点击之后则会看到你所爬取的关键词的所有内容，下面是代码示例：

3.4网络图片的爬取和存储

第5行代码含义是将url最后一个斜杠后是内容作为存储图片的文件名；try内的代码含义为先判断这个图片是否存在在你的存储路径中，如果没有则通过网络爬取并将文件保存。

憨憨不怕输

关注

12
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Diary04-Python网络爬虫-Requests库及实战示例

其中Response对象的属性有以下5种：通过r.status_code返回http请求状态，当输出为200时可以进行Response其他4个属性的输入；
复制链接

扫一扫

憨憨不怕输 CSDN认证博客专家 CSDN认证企业博客

码龄4年

28: 原创

120万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

708: 积分

236: 粉丝

427: 获赞

8: 评论

322: 收藏

私信

关注

热门文章

最新评论

Diary20-Word批量制作
CSDN-Ada助手: 亲爱的作者，恭喜您写下了第19篇博客！Word批量制作这个话题听起来很有意思呢。希望您能继续坚持创作，分享更多有趣的内容。我觉得下一步可以尝试探讨一些高级技巧或者结合实际案例进行分析，这样能够让读者更加深入地了解相关主题。期待您的下一篇作品！
Diary11-Word文字
CSDN-Ada助手: 亲爱的作者，恭喜您写下了第10篇博客《Diary11-Word文字》！您的持续创作精神令人钦佩，不断分享自己的心情和体验，让读者们都能感受到您的情感和思考。在接下来的创作中，或许可以尝试多样化的主题和形式，让读者能够更全面地了解您的世界。期待您更多精彩的作品，谢谢您的分享！
Diary12-Word表格
CSDN-Ada助手: 恭喜您写了第11篇博客，标题为“Diary12-Word表格”。您的持续创作真是令人钦佩！通过这篇博客，您向读者展示了如何利用Word表格的技巧，这无疑对那些需要处理大量数据的读者来说非常有帮助。在下一步的创作中，我谦虚地建议您可以考虑探索更多关于Word表格的高级技巧，比如如何应用公式和函数、如何进行数据筛选和排序等等。这样的内容将进一步提升您的博客质量，为读者带来更多实用的知识。再次恭喜您，并期待您未来更多精彩的博客！
Diary13-Word图片
CSDN-Ada助手: 恭喜你写完了第12篇博客，标题为“Diary13-Word图片”！你的创作能力真是令人钦佩。通过给博客加上Word图片，你不仅令读者更好地理解了内容，还提升了博客的可视化效果。接下来，我希望能看到你在博客中更多地运用多媒体元素，比如添加一些配图或者视频，这样可以进一步丰富你的内容。谦虚地说，我期待着你的下一篇作品！加油！
Diary14-Word样式设计
CSDN-Ada助手: 恭喜您写下了第13篇博客，标题为“Diary14-Word样式设计”！您的持续创作让人钦佩，能够坚持写作并分享自己的见解，真的很了不起。接下来，我建议您可以尝试在博客中分享一些实际的Word样式设计案例，或者是一些技巧和经验，让读者能够更具体地了解Word样式设计的方法和应用。当然，这只是一个建议，希望对您的创作有所帮助。期待您更多精彩的文章，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。