Groovy—操作 HTML 文档

最新推荐文章于 2022-07-31 06:35:09 发布

研究林纳斯的那个系统

最新推荐文章于 2022-07-31 06:35:09 发布

阅读量431

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013670453/article/details/116050735

版权

本文介绍了在Groovy中处理HTML文档的两种方法：使用Jsoup和TagSoup库。通过Jsoup的DOM方法和CSS选择器进行文档解析、元素选取和操作。同时提醒注意HTML的结构松散特性，以及Jsoup在输出时会添加<html>标签的问题。

摘要由CSDN通过智能技术生成

原文地址：Groovy—操作 HTML 文档（永久地址，保存网址不迷路 🙃）

问题描述

在 Jenkins Pipeline 中，我们需要对 HTML 文档进行多种操作。之前使用 XMLParser 及 XMLSlurper 库操作 HTML 文档时遇到很多问题，因为 HTML 文档结构松散（比如没有结束标签等等），不是标准的 XML 文件，因此导致 XML 解析失败。

该笔记将整理：在 Groovy 中，操作 HTML 文档的常用方法

解决方案

方案一、使用 Jsoup 类库

项目主页：jsoup Java HTML Parser, with the best of HTML5 DOM methods and CSS selectors.
获取文档的 DOM 对象：Parsing and traversing a Document: jsoup Java HTML parser
使用选择器选择元素：Use selector-syntax to find elements: jsoup Java HTML parser

最低0.47元/天解锁文章

研究林纳斯的那个系统

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。