python 爬虫（二）--requests库

最新推荐文章于 2024-05-27 17:00:50 发布

lulu001128

最新推荐文章于 2024-05-27 17:00:50 发布

阅读量43

点赞数

分类专栏：知识点文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lulu001128/article/details/129224449

版权

知识点专栏收录该内容

19 篇文章 8 订阅

订阅专栏

目录

response的属性

对比了urlib和requests的区别

cookie--登陆（古诗文网）

模块说明

requests是使用Apache2 licensed 许可证的HTTP库。

用python编写。

比urlib2模块更简洁。

Request支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动响应内容的编码，支持国际化的URL和POST数据自动编码。在python内置模块的基础上进行了高度的封装，从而使得python进行网络请求时，变得人性化，使用Requests可以轻而易举的完成浏览器可有的任何操作。现代，国际化，友好。

requests会自动实现持久连接keep-alive

安装requests

pip install requests

response的属性

.txt

print(response.txt)---以字符串的形式来返回了网页的源码

【如果返回中文形式有乱码，可能是编码格式的问题，可以设置响应编码格式

response.encoding = 'utf-8']

.url

返回url地址

对比了urlib和requests的区别

get请求

url 请求资源链接

params 参数

kwargs 字典

post请求

首先抓接口

url 请求地址

data 请求参数

kwargs 字典

此时返回的是中文

get和post返回参数的名不一样！！！

代理

proxy 代理

1.代理

有的网页检测到此ip为爬虫会拦截此时我们应该直接换ip即可

2.快代理

（不好使时，可以买，毕竟免费的不好使正常）

cookie--登陆（古诗文网）

我们的目标绕过登录页面，随便进入到其它哪个页面都可

！困难点，此页面有个验证码，动态验证码不好动

1.找登录接口

一般来说，带登陆的接口都有login

一般来说，看不到的变量都在页面源代码中

hidden，隐藏域，页面中不显示但是页面中存在

所以我们需要获取页面源码，然后进行解析就可以获取了

检索一下，自己所获取的源代码中，是否含有自己想要的东西，万一此项反扒呢！

下面这一步，进行解析，要先学会bs4的语法，或者xpath的语法

id选择器#

select 返回的是一个列表

[0].attrs 列表中的属性

现在进行验证码的分析

定位验证码知道它大概是一个img图片，找它的地址

学习requests，最好先将urllib也学会

抓登录接口

preserve log

如果不勾上，之前被执行过的页面可能就被覆盖住了，是为了防止chrome浏览器版本过低

一般不勾上

直接输入错误的密码

它就不会跳转到下一页面，便于查找

此时验证，你会发现不成功，因为一直会报验证码错误，那就证明上面我们所提到的坑，是很重要的，可能出了问题

一直报错是因为，你提交时的验证码和你截取时看到的验证码不一样了已经，在你提交的时候就已经更新了一遍了，所以会一直报错

发现旁边没有验证码图片不要慌张，在本地找一下

requests 超级鹰打码平台使用（自动破解验证码）

下载后可解压文件夹，后进行使用，

将图片，和代码文件拖入文件列表中，则可进行编辑

根据提示修改相应部位

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫（二）--requests库

尚硅谷视频
复制链接

扫一扫

专栏目录

lulu001128 CSDN认证博客专家 CSDN认证企业博客

码龄2年

77: 原创

109万+: 周排名

15万+: 总排名

3万+: 访问

: 等级

802: 积分

33: 粉丝

28: 获赞

3: 评论

186: 收藏

私信

关注

热门文章

分类专栏

比赛 15篇
作业 13篇
ctfshow 1篇
知识点 19篇
bugku 9篇
攻防世界 2篇
兴趣 4篇
资料 1篇
上课内容 4篇
buuctf 4篇
unctf 1篇
ctfhub 4篇
DIFFICULTY 1篇

最新评论

2023年蓝帽杯取证复现
人工智能教学实践: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文，同时也希望可以来我博客指导我一番！
BUUCTF--web基础{HAVE FUN}
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。