python实现带验证码网站的自动登陆实现代码

最新推荐文章于 2024-05-24 16:44:18 发布

老程序员阿福

最新推荐文章于 2024-05-24 16:44:18 发布

阅读量3.5k

点赞数

分类专栏： python基础编程文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haoxun11/article/details/104931463

版权

本文介绍了使用Python的urllib2库实现带有验证码的网站自动登录的过程，包括激活Cookie、处理验证码、表单提交和判断登录状态等步骤。示例代码展示了如何进行多账号轮询登录并下载页面。

摘要由CSDN通过智能技术生成

本例所登录的某网站需要提供用户名，密码和验证码，在此使用了python的urllib2直接登录网站并处理网站的Cookie
早听说用python做网络爬虫非常方便，正好这几天单位也有这样的需求，需要登陆XX网站下载部分文档，于是自己亲身试验了一番，效果还不错。

本例所登录的某网站需要提供用户名，密码和验证码，在此使用了python的urllib2直接登录网站并处理网站的Cookie。

Cookie的工作原理：
Cookie由服务端生成，然后发送给浏览器，浏览器会将Cookie保存在某个目录下的文本文件中。在下次请求同一网站时，会发送该Cookie给服务器，这样服务器就知道该用户是否合法以及是否需要重新登录。

Python提供了基本的cookielib库，在首次访问某页面时，cookie便会自动保存下来，之后访问其它页面便都会带有正常登录的Cookie了。

原理：

（1）激活cookie功能
（2）反“反盗链”，伪装成浏览器访问
（3）访问验证码链接，并将验证码图片下载到本地
（4）验证码的识别方案网上较多，python也有自己的图像处理库，此例调用了火车头采集器的OCR识别接口。
（5）表单的处理，可用fiddler等抓包工具获取需要提交的参数
（6）生成需要提交的数据，生成http请求并发送
（7）根据返回的js页面判断是否登陆成功
（8）登陆成功后下载其它页面

此例中使用多个账号轮询登陆，每个账号下载3个页

最低0.47元/天解锁文章

老程序员阿福

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python实现带验证码网站的自动登陆实现代码

本例所登录的某网站需要提供用户名，密码和验证码，在此使用了python的urllib2直接登录网站并处理网站的Cookie早听说用python做网络爬虫非常方便，正好这几天单位也有这样的需求，需要登陆XX网站下载部分文档，于是自己亲身试验了一番，效果还不错。本例所登录的某网站需要提供用户名，密码和验证码，在此使用了python的urllib2直接登录网站并处理网站的Cookie。Cookie...
复制链接

扫一扫

专栏目录

老程序员阿福 CSDN认证博客专家 CSDN认证企业博客

码龄5年

77: 原创

24万+: 周排名

132万+: 总排名

24万+: 访问

: 等级

3224: 积分

65: 粉丝

86: 获赞

25: 评论

607: 收藏

私信

关注

热门文章

分类专栏

python基础编程 75篇

最新评论

python基础编程：基于Python对象引用、可变性和垃圾回收详解
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8082547, 请多输出高质量博客, 帮助更多的人
python基础编程：解决python明明pip安装成功却找不到包的问题
qq_36376711: 请不要照搬我的文章不做任何修改还打个原创标签
python基础编程：python数据结构之图深度优先和广度优先实例详解
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7999917, 请多输出高质量博客, 帮助更多的人
python编程基础：python 实现GUI(图形用户界面)编程详解
失心疯_2023: 博主文章写的非常详细，学到了很多新的知识点，感谢博主分享！ ============================================ Python项目虚拟环境(超详细讲解)：https://blog.csdn.net/weixin_50296259/article/details/130738875 资源下载合集：https://blog.csdn.net/weixin_50296259/article/details/130674430 Python GUI文章合集：https://blog.csdn.net/weixin_50296259/article/details/130674350 Oracle数据库文章合集：https://blog.csdn.net/weixin_50296259/article/details/130739064
python通过百度地图API获取某地址的经纬度详解
m0_67732133: 老师您好，请问运行后点击url显示240该怎么处理呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。