java网络爬虫实验报告_Java网络爬虫实操（6）

最新推荐文章于 2024-05-14 19:21:39 发布

ProtonPrivacy

最新推荐文章于 2024-05-14 19:21:39 发布

阅读量795

点赞数

文章标签： java网络爬虫实验报告

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42531396/article/details/114927897

版权

大家好，前几篇文章一直提到用xpath去解析html。由于是演示代码，所以看上去都简洁明了的。其实在生产环境下，我们需要获取的数据往往不是一点点，如何让获取数据的代码写的更加清晰、优雅呢？

本篇文章尝试用注解的方式实现一下，大家看看是否好一点。

1) 目标

随便找一个网站，获取上面列表类的数据

41ff003fd07a

目标数据的界面

2) 之前的解析类

在process方法中围绕我们想要的数据，努力去定位、查找

package com.cv4j.netdiscovery.example;

import com.cv4j.netdiscovery.core.domain.Page;

import com.cv4j.netdiscovery.core.parser.Parser;

import java.util.List;

public class TestParser implements Parser {

@Override

public void process(Page page) {

//最新网申

List newApplyList = page.getHtml().xpath("//dl[@id='dlFull']/dd/div/div/p[@title]/a/text()").all();

page.getResultItems().put("newApplyList", newApplyList);

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java网络爬虫实验报告_Java网络爬虫实操（6）

大家好，前几篇文章一直提到用xpath去解析html。由于是演示代码，所以看上去都简洁明了的。其实在生产环境下，我们需要获取的数据往往不是一点点，如何让获取数据的代码写的更加清晰、优雅呢？本篇文章尝试用注解的方式实现一下，大家看看是否好一点。1) 目标随便找一个网站，获取上面列表类的数据目标数据的界面2) 之前的解析类在process方法中围绕我们想要的数据，努力去定位、查找package com...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。