- 博客(1)
- 收藏
- 关注
原创 JSoup+Htmlunit爬取分页组件中的分页数据
JSoup+htmlunit爬取分页组件中的数据 业务需求场景 爬取XX网站中的球队数据-球队的比赛赛程(所有赛程放在一个分页主件中的) 这里不像传统的分页页面,需要传入一个page页码再去请求,然后再去爬取table 中的数据 解决思路 利用 htmlunit 去模拟点击事件(这里指点击下一页),循环点击去取到每一页的结果(效率低,建议后面存缓存或者入库) 分析页面: 我们可以发现数据是放在...
2019-04-29 12:04:58
1422
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人