使用jxbrowser7 做爬虫采集

1、jxborwser7介绍

        jxborwser7对于jxborwser6进行了大规模重构,放弃了对xp的支持,支持win7以上版本,提高了性能。

2、爬虫思路

  爬虫就是拦截服务器对于浏览器的返回内容,所以我们要用到jxbrowser的network模块,network模块中从发起请求到返回结果的流程如下图:

经过阅读官网文档,我发现 ResponseBytesReceived 事件可以获取到服务器给浏览器返回的数据,然后我们判断下url就可以拿到服务器返回的json了。

browserView.getBrowser().profile().network().on(ResponseBytesReceived.class, event -> {
                if(event.urlRequest().equals("https://xx.xx.cn/api") ){
                    byte[] data = event.data();
                    try {
                        String body = new String(data, "UTF-8");
                        JSON jsonBody = JSONUtil.parse(body);
                    } catch (UnsupportedEncodingException e) {
                        throw new RuntimeException(e);
                    }
                }
            });

3、参考代码

jxborwser官网提供了一些api的使用demo:

GitHub - TeamDev-IP/JxBrowser-Examples at v7.32

另外我使用jxborwser做了一个开源浏览器,也可以学习。

easy-browser: java开源浏览器,基于jxbrowser实现

4、其他交流

可以加QQ群 468075224 一起交流jxbrowser的使用。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值