题目要求:
通过访问武夷山门票预订网w.wyschina.com先注册一个账号,获得账号和密码后,通过JAVA爬虫自动登录sso.wyschian.com,登陆过程通过【打码兔www.dama2.com】平台的接口破解验证码实现自动登录。
答:
网站分析后发现可以使用post请求加上参数进行登录,参数有用户名,密码,验证码组成
访问验证码的连接可以得到验证码图片流
访问 http://sso.wyschina.com/createimage?Rgb=255|0|0&r=%27+randomNumber(10000));
然后去拼接请求地址
http://sso.wyschina.com//SSOAuth?username=你的用户名&password=你的密码&random=7268
毫无疑问,只要每次待着这个cookie即可访问这个用户的信息。我直接用postman工具把cookie添加上去,去访问
http://w.wyschina.com/order/firstPage.action
用户信息的网址
直接请求,即可登陆到该用户上
思路分析完成
总结思路:
可以通过打码兔,若快等识别验证码的功能识别出网站的数字验证码。
通过批量读取已有的用户名密码去访问登录接口。并将返回的需要设置的cookie内容。
再用httpclient在header中添加好cookie去访问用户信息接口,通过爬虫将信息保存。
然后呢? while(true){ do something.去吧}