java爬取验证码图片_JAVA HttpClient实现页面信息抓取(获取图片验证码并传入cookie实现信息获取)...

64e70440502ce2c2fcbdd51283295868.png

有时候我们的程序中需要调用第三方接口获取数据,比如在这里需要在我的程序里实现用户输入汽车号牌等信息就可以查到用户的违章信息,在没有其他方法的情况下我就得想办法在官网获取信息。上图是官网获取信息的网站页面。

传统的ajax请求不可能实现,光不能跨域这一点就实现不了。

使用java的post请求可以实现,在一般这种网站安全保护较高,不会让你随意访问,一般的做法就是进入网站首页时request中返回cookie,以后的每次操作后台都会比对你传入的cookie是否相同,相同则认为你是从浏览器首页点进来的,正常显示。请求信息的cookie不同或没有cookie,则认为是机器程序访问,禁止访问。

要想获取首页的cookie,我们需要先用java请求首页,获取cookie,以后的每次请求都将此cookie set进去即可。

因为要请求数据还有要输入图片验证码这一步。网站传输的图片验证码一般都是返回文件流,设置到img 的src属性里面。所以我们需要先获取这个图片验证码返回给前台。用户看到验证码可以填写验证码和其他信息提交。我再用java请求官网并将参数一并传入,当然不要忘了传cookie,这样就可以顺利获取官网返回的违章信息了。

具体代码如下:

引入httpclient相关的包

import net.sf.json.JSONArray;

import net.sf.json.JSONObject;

import org.apache.commons.collections.map.ListOrderedMap;

import org.apache.commons.httpclient.Cookie;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.HttpException;

import org.apache.commons.httpclient.cookie.CookiePolicy;

import org.apache.commons.httpclient.methods.GetMethod;

import org.apache.commons.httpclient.methods.PostMethod;

import org.apache.commons.httpclient.params.HttpMethodParams;

import org.apache.commons.lang.StringUtils;

//违章查询官网页面抓取图片验证码(第一步)

public void getImage(){

HttpServletRequest request = ServletActionContext.getRequest();

HttpServletResponse response = ServletActionContext.getResponse();

//初始化httpclient

HttpClient httpClient = new HttpClient();

//首先把进入山西交警官网的首页得到cookie(里面会包括token和sessionid等);

String url1 =

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值