java-爬虫-Jsoup使用

最新推荐文章于 2023-12-14 15:29:09 发布

特特专属

最新推荐文章于 2023-12-14 15:29:09 发布

阅读量565

点赞数

分类专栏： java 爬虫文章标签： java 爬虫

本文链接：https://blog.csdn.net/constant_rain/article/details/119901132

版权

java 同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

爬虫

1 篇文章 0 订阅

订阅专栏

Jsoup使用第一步导入pom文件

		<dependency>
                <!-- jsoup HTML parser library @ https://jsoup.org/ -->
                <groupId>org.jsoup</groupId>
                <artifactId>jsoup</artifactId>
                <version>1.12.1</version>
          </dependency>

Jsoup使用案例

public static void main(String[] args) {
        List<String> list = new ArrayList<>();
        String html = HttpUtil.get("https://github.com/fastlane/fastlane/releases");
        Document parse = Jsoup.parse(html);
        Element body = parse.body();
        Elements title = body.getElementsByClass("commit js-details-container Details");
        title.forEach(element -> {
            String tag = element.select("a").first().text();
            String text = element.select("pre").text();
            list.add(tag + " " + text);
        });
    }

Jsoup方法说明

Jsoup.parse：解析html格式的文本为Document对象

parse.body: 获取Html里面的body体里面的内容

body.getElementsByClass：通过标签中的class获取内容

element.select(“a”) : 获取当前内容中带有a的标签

element.select(“a”).first()：选择当前元素中第一个a标签

element.select(“a”).first().text()：选择当前元素中第一个a标签的内容

特特专属

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
java-爬虫-Jsoup使用

Jsoup使用第一步导入pom文件 <dependency>  <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <ver
复制链接

扫一扫