groovy 读取html文件,「Groovy」- 操作 HTML 文档 @20210307

最新推荐文章于 2021-06-27 22:51:35 发布

哈里叔叔

最新推荐文章于 2021-06-27 22:51:35 发布

阅读量740

点赞数

文章标签： groovy 读取html文件

问题描述在 Jenkins Pipeline 中，我们需要对 HTML 文档进行多种操作。之前使用 XMLParser 及 XMLSlurper 库操作 HTML 文档时遇到很多问题，因为 HTML 文档结构松散(比如没有结束标签等等)，不是标准的 XML 文件，因此导致 XML 解析失败。该笔记将整理：在 Groovy 中，操作 HTML 文档的常用方法解决方案方案一、使用 Jsoup 类库方案...

摘要由CSDN通过智能技术生成

问题描述

在 Jenkins Pipeline 中，我们需要对 HTML 文档进行多种操作。之前使用 XMLParser 及 XMLSlurper 库操作 HTML 文档时遇到很多问题，因为 HTML 文档结构松散(比如没有结束标签等等)，不是标准的 XML 文件，因此导致 XML 解析失败。

该笔记将整理：在 Groovy 中，操作 HTML 文档的常用方法

解决方案

方案一、使用 Jsoup 类库

方案二、使用 TagSoup 类库

我们未验证该方法，只是阅读 Grape 手册时发现该方法，这里仅简单记录：

// find the PDF links of the Java specifications

@Grab(group='org.ccil.cowan.tagsoup', module='tagsoup', version='1.2.1')

def getHtml() {

def parser = new XmlParser(new org.ccil.cowan.tagsoup.Parser())

parser.parse("https://docs.oracle.com/javase/specs/")

}

html.body.'**'.a.@href.grep(~/.*\.pdf/).each{ println it }

方案一、使用 Jsoup 类库

简单的入门示例

@Grab(group='org.jsoup', module='jsoup', version='

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
groovy 读取html文件,「Groovy」- 操作 HTML 文档 @20210307

问题描述在 Jenkins Pipeline 中，我们需要对 HTML 文档进行多种操作。之前使用 XMLParser 及 XMLSlurper 库操作 HTML 文档时遇到很多问题，因为 HTML 文档结构松散(比如没有结束标签等等)，不是标准的 XML 文件，因此导致 XML 解析失败。该笔记将整理：在 Groovy 中，操作 HTML 文档的常用方法解决方案方案一、使用 Jsoup 类库方案...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。