Java 模拟58登录(二) 实现
标签(空格分隔): Java
实习期间需要做一个模拟58登录然后爬取简历,之前已经写了一篇分析,现在具体实现过程
有关过程的分析,可以参考我的另一篇博客 Java 模拟58登录(一) 分析
实现
流程
根据之前的分析可以得出58登录的大致流程如下
- 发送Get请求(data?), 获取 token
- 发送Get请求(getcode?), 请求发送手机验证码, 同时获得一个tokencode
- 发送Get请求(login?), 输入手机号,动态码以及其他相关参数来发送登录请求
- 登录成功
预处理
除了上述所说的步骤外,还有很多需要处理的底层实现细节,比如解析Cookie, 构造必须的参数
设置必须参数
- FINGERPRINT 和FINGERPRINT2是网页登录的时候直接抓取的,我试过随机修改后面几个数字依旧可以登录
- JQUERYSTR 只是jquery调用时候自动生成的参数,为了不出现什么问题我也加上了
- initTime initTime表示页面加载时间,后面加密时候需要用到的时间戳这个参数,这里所有需要的时间戳都是(需要的时间戳时刻b-initTime+ const time 1411093327735L)
- TOKENCODE 和 TOKEN 是调用的时候获取的参数
private String FRONTEND_URL = "http://passport.58.com/frontend/data?";
private String TOKENCODE_URL = "http://passport.58.com/mobile/getcode?";
private String LOGIN_URL = "https://passport.58.com/mobile/pc/login?";
private String FINGERPRINT = "421A592E9D98DC7C0711A36033A582E84360ED23C621CCE3_011";
private String FIGNERPRINT2 = "zh-CN|24|1|4|1600_900|1600_860|-480|1|1|1|undefined|undefined|"
+ "unknown|Win64|unspecified|1|false|false|false|true|false|"
+ "0_true_true|d41d8cd98f00b204e9800998ecf8427F|b01de87fcefd32c68d348cd9d18b62d9";
private String JQUERYSTR = "jQuery183025066063002634587_" + getNow();
private long initTime = (new Date()).getTime();
private String TOKENCODE = "";
private String TOKEN = "";
解析Cookie
这里实际写的时候遇到了坑点, 最初底层实现Cookie是参考stackoverflow中的那种实现
但是如果Cookie value中含有”=”,解析就是失败,刚好58的session Cookie 中含有这个!!!我也是失败很多次才知道
protected CookieStore cookieStore = new BasicCookieStore();
public void setCookieStore(HttpResponse httpResponse) {
Header[] headers = httpResponse.getHeaders("Set-Cookie");
if (h