java获取标签指定内容

问题

需要处理HTML片断 (一个不完整的HTML文档),从中提取a标签中href的内容

方法

引入Jsoup,maven依赖导入地址链接(博主使用版本为1.11.3)

代码实例

有段字符串包含许多标签,href有两个,我们取出第一个:

String html = "<p style="line-height: 16px;"><img src=""/><a style="" href="" title="测试1">测试1</a></p><p style="line-height: 16px;"><img src=""/><a style="" href="" title="测试2">测试2</a></p>";
Document doc = Jsoup.parseBodyFragment(html);
Element e_a =doc.getElementsByTag("a").get(0);//得到第一个a标签内容
String href = e_a.attr("href");

:Jsoup.parseBodyFragment和Jsoup.parse的区别:
parseBodyFragment 方法创建一个空壳的文档,并插入解析过的HTML到body元素中。假如使用 Jsoup.parse方法,也可以得到相同的结果。但是使用Jsoup.parseBodyFragment明确将用户输入作为 body片段处理,确保用户所输入的任何糟糕的HTML都将被解析成body元素。

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值