java获取标签指定内容

最新推荐文章于 2024-04-23 17:29:36 发布

java真好喝

最新推荐文章于 2024-04-23 17:29:36 发布

阅读量5.3k

点赞数 1

分类专栏： java笔记文章标签： Jsoup

本文链接：https://blog.csdn.net/weixin_42043101/article/details/100734391

版权

java笔记专栏收录该内容

29 篇文章 2 订阅

订阅专栏

问题

需要处理HTML片断 (一个不完整的HTML文档)，从中提取a标签中href的内容

方法

引入Jsoup，maven依赖导入地址链接（博主使用版本为1.11.3）

代码实例

有段字符串包含许多标签，href有两个，我们取出第一个：

String html = "<p style="line-height: 16px;"><img src=""/><a style="" href="" title="测试1">测试1</a></p><p style="line-height: 16px;"><img src=""/><a style="" href="" title="测试2">测试2</a></p>";
Document doc = Jsoup.parseBodyFragment(html);
Element e_a =doc.getElementsByTag("a").get(0);//得到第一个a标签内容
String href = e_a.attr("href");

注：Jsoup.parseBodyFragment和Jsoup.parse的区别：
parseBodyFragment 方法创建一个空壳的文档，并插入解析过的HTML到body元素中。假如使用 Jsoup.parse方法，也可以得到相同的结果。但是使用Jsoup.parseBodyFragment明确将用户输入作为 body片段处理，确保用户所输入的任何糟糕的HTML都将被解析成body元素。

java真好喝

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
java获取标签指定内容

问题需要处理HTML片断 (一个不完整的HTML文档)，从中提取a标签中href的内容方法引入Jsoup，maven依赖导入地址链接代码实例有段字符串包含许多标签，href有两个，我们取出第一个：String html = "<p style="line-height: 16px;"><img src=""/><a style="" href="" t...
复制链接

扫一扫