gecco爬虫框架使用指南
FileUtil.writeFile("进入详情页=="+bean.getUrl()+ System.lineSeparator(),"E:\\","answer.txt","UTF-8");// System.out.println("列表循环详情页"+bean.getTitle());该实现类的作用即为匹配爬取的url进行处理。如启动类第一个url,适配获取html中的页码及想要的信息等。该类即处理第二步中获取的详细信息的类,可以翻页继续爬取等。//开始抓取的页面地址。
原创
2022-09-20 13:26:38 ·
736 阅读 ·
0 评论