java使用jvppeteer爬取网页中某个接口的数据

最新推荐文章于 2024-05-16 09:46:44 发布

noob_hang

最新推荐文章于 2024-05-16 09:46:44 发布

阅读量1.4k

点赞数 1

分类专栏：爬虫文章标签： java 爬虫

本文链接：https://blog.csdn.net/qq_41699033/article/details/116064572

版权

Puppeteer 模拟浏览器数据抓取 JSON解析数据库存储

关键词由CSDN通过智能技术生成

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、引入依赖

<dependency>
   <groupId>io.github.fanyong920</groupId>
   <artifactId>jvppeteer</artifactId>
   <version>1.1.3</version>
</dependency>

二、模拟浏览器行为访问页面

Browser browser = Puppeteer.launch(false);
        Page page = browser.newPage();
        page.on("response", new EventHandler<Response>() {
            @Override
            public void onEvent(Response o) {
                try {
                    //需要监听的接口
if(o.url().equals("https://www.toolsunited.com/App/EN/TuMenu/GetJsonResultList")){
                        JSONObject jsonObject = JSONObject.parseObject(o.text());
                        JSONArray resultList = jsonObject.getJSONArray("ResultList");
                        for (int i = 0; i < resultList.size(); i++) {
                            JSONObject object = resultList.getJSONObject(i);
                            TToolEntity tToolEntity = new TToolEntity();
                            tToolEntity.setCompanyCode(object.getString("CompanyCode"));
                            tToolEntity.setDeliveryState(object.getString("DeliveryState"));
                            tToolEntity.setToolId(object.getString("ID"));
                            tToolEntity.setDefaultImage(object.getString("DefaultImage"));
                            tToolEntity.setLabel(object.getString("Label"));
                            tToolEntity.setIdnr(object.getString("IDNR"));
                            tToolEntity.setClassLabel(object.getString("ClassLabel"));
                            tToolEntity.setResultSpecificValues(object.getJSONArray("resultSpecificValues").toString());
                            tToolDao.insert(tToolEntity);
                        }
                    }
                }catch (Exception e){
                    e.printStackTrace();
                }
                /*System.out.println("hahah");
                System.out.println(o.url());*/
            }
        });
        //访问的url
        page.goTo(url);
        browser.close();

noob_hang

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
java使用jvppeteer爬取网页中某个接口的数据

一、引入依赖<dependency> <groupId>io.github.fanyong920</groupId> <artifactId>jvppeteer</artifactId> <version>1.1.3</version></dependency>二、模拟浏览器行为访问页面Browser browser = Puppeteer.launch(false);
复制链接

扫一扫