【爬虫基础1.1课】——requests模块上

如桃花来

已于 2024-05-10 15:41:55 修改

阅读量449

点赞数 4

分类专栏：爬虫从0开始从0基础到python大神的究极成长之路文章标签：爬虫 c++ 开发语言

于 2024-05-09 21:00:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_76312306/article/details/137124159

版权

从0基础到python大神的究极成长之路同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

爬虫从0开始

1 篇文章 0 订阅

订阅专栏

目录索引

==requests模块的作用：==
- 实例引入：
==特殊情况：==
- 锦囊1：
- 锦囊2:

这一个栏目，我会给出我从零开始学习爬虫的全过程。感兴趣的小伙伴可以关注一波，用于复习和新学都是不错的选择。
那么废话不多说，就让我们开始吧。
请跟我念口号：
爬虫，爽！

requests模块的作用：

一句话概括：用于发送和接受网站的响应。

Tips: 你给谁发请求，接收到的就是哪个网页传回来的响应。所以想学好爬虫，第一步就是向正确的网址发送响应。

`实例引入：`

比如说我们拿京东网站来举例。里面有非常多的数据，包括一切动态加载的数据。那如果我要只想要当前网页的静态数据，该怎么获取呢？

在这里插入图片描述
2.打开网页检查

在这里插入图片描述

这里面最重要的两个按钮就是：元素和网络。
其中，元素是整个网页的html代码。
而网络是我们爬虫的重点。

3.进入到网络界面后，找到对应的url

记得要刷新一下，这里面有各种各样的数据，包括动态的。我们需要将当前网页的网址复制到搜索框里进行检索。

在这里插入图片描述

那么跳出来的响应，就是我们要的当前网页返回的数据

4.检查url是否正确

从响应里面的response查看、搜索里面是否有我们需要的数据

在这里插入图片描述

特殊情况：

我们在实际使用爬虫的过程中，经常会遇到内容不在该页面或者压根找不到的情况。非常麻烦，那该怎么办呢？
莫慌，吾有良计！

锦囊1：

利用search按钮，对全页面的response数据进行总检索。

例子展示：

我们首先要拿出最经典的豆瓣电影网来做参考：

功夫是一个相当经典的电影。看上述图片，我们用本文开篇提到的搜索方法，发现功夫这个词条根本就不存在当前网页的response中。这时候我们就需要用到search按钮。

在这里插入图片描述

控制台中左上角的这个小放大镜，就是我们提到的search按钮。它的功能是在所有的response中检索相应的词条。

在这里插入图片描述

这下我们就能找到相应的url了，是不是非常简便呢。

锦囊2:

利用翻页的异步请求方式。如果锦囊1依旧找不到对应的url的话，我们就需要使用异步请求来查看对应的url。

1.首先清空网页内容，点击红框按钮即可。

在这里插入图片描述
2.我们都知道前端页面的设计具有规律性，网页中第2页获取请求的方式，跟第一页是一样的。所以我们会通过查看第二页的方式来获取对应的url。

在这里插入图片描述
3.寻找页码规律就可以找出对应的url了。最后，我们会得到一个json格式的数据。

在这里插入图片描述

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
【爬虫基础1.1课】——requests模块上

功夫是一个相当经典的电影。看上述图片，我们用本文开篇提到的搜索方法，发现功夫这个词条根本就不存在当前网页的response中。2.我们都知道前端页面的设计具有规律性，网页中第2页获取请求的方式，跟第一页是一样的。控制台中左上角的这个小放大镜，就是我们提到的search按钮。它的功能是在所有的response中检索相应的词条。如果锦囊1依旧找不到对应的url的话，我们就需要使用异步请求来查看对应的url。记得要刷新一下，这里面有各种各样的数据，包括动态的。那么跳出来的响应，就是我们要的当前网页返回的数据。
复制链接

扫一扫

专栏目录

如桃花来 CSDN认证博客专家 CSDN认证企业博客

码龄1年

79: 原创

110万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

979: 积分

82: 粉丝

106: 获赞

45: 评论

92: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Excel超实用快捷键！！！办公效率1000%up!up!up!】
CSDN-Ada助手: 非常感谢您分享这么有用的Excel快捷键，相信会大大提高办公效率！期待您在未来分享更多类似的实用技巧。如果您方便的话，可以考虑写一篇关于利用Excel进行数据分析或者数据可视化的技术博客，给读者展示如何通过Excel处理海量数据并快速生成可视化报表，帮助读者更好地应对数据分析和决策。期待您的精彩分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
【初识django】——Django02——如桃花来
stackY、: 大佬讲的实用性操作很不错，值得推荐
【初始scrapy框架下】——全栈开发——如桃花来
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615448129?utmsource=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utmsource=blogger_star_comment。
【集合详解】——python基础——如桃花来
小余要努力: 支持大佬原创好文章，望回关
【内置函数】——高级编程——如桃花来
码银: 内置函数💪

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

如桃花来 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。