Python 爬虫模拟登陆

最新推荐文章于 2022-07-14 17:27:28 发布

e_sparta

最新推荐文章于 2022-07-14 17:27:28 发布

阅读量568

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26237781/article/details/77991921

版权

作为一个啥也不懂的小白。为了毕业开始好好写程序和心得。

最近开始忙毕业项目，数据需要使用爬虫获取。于是打算把整个过程用csdn的博客记录下来

首先爬取网页，尤其是社交网站最需要的就是在爬取之前进行登录。

这个爬虫的目的是模拟登录豆瓣网，并验证性的做一个跳转。

主要难点还是在于验证码的处理上。

由于第一次请求的网页附带的验证码和第二次的不同所以会出现一个问题验证码不统一。

于是我们需要使用cookie将登录数据整合起来发送给需要接受的url

这是登录的网页的 url

这是网页以及post的信息

其中 post代表的是将这个页面的登录信息发送给 www.douban.com

所以具体的流程就是在第一个url中请求后判断有无验证码，再将登录信息发给需要访问的主页。

代码如下

# -*- coding: utf-8 -*-

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python 爬虫模拟登陆

作为一个啥也不懂的小白。为了毕业开始好好写程序和心得。最近开始忙毕业项目，数据需要使用爬虫获取。于是打算把整个过程用csdn的博客记录下来首先爬取网页，尤其是社交网站最需要的就是在爬取之前进行登录。这个爬虫的目的是模拟登录豆瓣网，并验证性的做一个跳转。主要难点还是在于验证码的处理上。由于第一次请求的网页附带的验证码和第二次的不同所以会出现一个问题验证码不统一。于是我们需要使
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。