java爬虫实战——动态获取网站数据

本文介绍了使用Java实现爬虫动态获取购物网站数据的过程,包括创建Maven项目、引入相关库、编写代码实现翻页及自动跳转到商品详情页并回退,从而循环获取多页商品详细信息。虽然目前仅在控制台输出,但作者计划进一步完善,将数据导出为Excel文件并进行中外文转换。
摘要由CSDN通过智能技术生成

#1024程序员节#

通过java实现爬虫动态获取网站数据

       通过上次demo的实现,是我对于爬虫有了一定的了解与认识,并进行了深入的研究与学习,成功的动态获取https://saudi.souq.com/中更多的数据。
       上次demo之后,我发现每次通过商品列表获取到的数据有限,只有那么几个,我就在想如何可以实现自动点击商品,进入到商品详情页面,获取更多数据,然后再返回商品列表页面。这样形成一个循环,用来获取跟多的数据。经过思考与尝试,终于实现此功能。

1.创建maven项目
       首先还是先创建一个maven项目。
在这里插入图片描述
2.引入相关jar包
       因为工作原因,还没来得及实现将数据导出为excel文件,所以还是只有控制台输出。引入jar包如下。
在这里插入图片描述
3.代码编写
       在此次代码中加入了自动跳转进入商品详情页,获取数据之后再返回商品列表页,并进行循环获取。
       代码中最外层for循环的作用是实现翻页操作,当第一页商品的数据获取结束之后,跳转到第二页商品列表页,继续循环获取商品详细数据。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值