[置顶]Java丨jsoup网络爬虫模拟登录思路解析

最新推荐文章于 2022-08-04 17:07:39 发布

lihaojie1996

最新推荐文章于 2022-08-04 17:07:39 发布

阅读量2.7k

点赞数 6

分类专栏： Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lihaojie1996/article/details/56676807

版权

Java 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

直奔主题：

本篇文章是给有jsoup抓包基础的人看的......

今天小编给大家写一篇对于jsoup抓包时需要输入验证码的解决方法之一。大神就绕道，嘿嘿~

任何抓包的基础都是基于Http协议来进行这个抓包行为的，那么，在我们遇到验证码的时候怎么办呢?别着急，继续看

遇到需要验证码的这种情况怎么办：

　　例如我们要访问www.xxxxx.com这个网站需要你输入验证码，步骤如下：

1）首先我们二话不说,先访问一下www.xxxxx.com这个网址,目的是什么？

a.获取到cookies

b.为我们下一步获取验证码做好准备

c.利用jsoup对www.xxxxx.com的第一次访问获取到的cookie来进行我们第二次的访问。

2)我们第一次访问完毕后进行第二次访问要做些什么呢？

a.利用jsoup带着cookie去访问www.xxxxx.com/img/verifyCode.gif这个地址获取验证码

b.将获取到的验证码存入到本地(一般获取到的是二进制形式的)

c.利用jsoup带着cookie到www.xxxxx.com/img/verifyCode.gif获取到的验证码我们是不是可以登录了呢?

3）第三次访问我们带入帐号+密码+验证码去登录重要的是不要把cookie忘带了

a.第三次访问www.xxxx.com/login.html?username=haojieli&password=123456&verifyCode=1234 在后面跟上cookie的值

解析：

重点是cookie ，cookie是会话的首要条件，cookie就相当于你要打电话，你输入的电话要和对方的电话号码对得上才能通上话，所以后面获取验证码和登录都必须带上cookie，这是你访问对方服务器的时候识别你的标准。

反之：你到服务器获取验证码时候的cookie为123456789 ，而你登录的时候的cookie是888888888 ，你打的电话都不是同一个电话，接电话的肯定不是同一个人，所以，访问的时候注意保持cookie的一致！

博文到此结束，感谢您的观看，希望对各位读者有所帮助，如果有什么意见以及建议请在评论留言......

======祝各位读者生活愉快======

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[置顶]Java丨jsoup网络爬虫模拟登录思路解析

直奔主题：本篇文章是给有jsoup抓包基础的人看的......今天小编给大家写一篇对于jsoup抓包时需要输入验证码的解决方法之一。大神就绕道，嘿嘿~任何抓包的基础都是基于Http协议来进行这个抓包行为的，那么，在我们遇到验证码的时候怎么办呢?别着急，继续看遇到需要验证码的这种情况怎么办：　　例如我们要访问www.xxxxx.com这个网站需要你输入验证码，步骤如下：1）首
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。