java爬取数据_Java一键爬取数据并保存到Excel

这篇博客介绍了如何利用Java爬虫库WebMagic结合Apache POI将爬取到的网页数据保存到Excel文件中。文章详细讲解了Gradle配置、Pipeline接口的实现以及数据保存到Excel的步骤,包括线程安全的考虑。
摘要由CSDN通过智能技术生成

201610181557196870.jpg

码农公社  210.net.cn  210= 1024  10月24日一个重要的节日--码农(程序员)节

将爬取到的数据保存为一个Excel,官方没有给出导Excel 的教程 这里发一个导为Excel的教程  导包 这里做的是Gradle配置。

//爬虫包

compile group: 'us.codecraft', name: 'webmagic-core', version: '0.7.3'

compile group: 'us.codecraft', name: 'webmagic-extension', version: '0.7.3'

//poi包 office操作

compile group: 'org.apache.poi', name: 'poi', version: '4.0.1'

maven的话也发一个吧

org.apache.poi

poi

4.0.1

us.codecraft

webmagic-core

0.7.3

us.codecraft

webmagic-extension

0.7.3

实现原理

这里我实现了Pipeline接口这个接口是保存结果的

从这个接口里进行保存操作

这里的save()命令加了个synchronized的目的是为了防止多线程操作的时候出现线程安全的问题

实现代码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值