Jsoup文档--解析body片段

解析body片段

问题

有一个body HTML片段(e.g. 包含一些p标签的div;一个不完整的HTML文档)需要解析,它可能是由用户提交的评论,或是在CMS(内容管理系统)中编辑页面的主体。

解决方案

使用Jsoup.parseBodyFragment(html)方法。

String html = "<div><p>Lorem ipsum.</p>";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();

描述

parseBodyFragment方法创建一个空文档,并插入解析过的HTML到body元素中。使用普通的Jsoup.parse(String html)方法通常也可以得到相同的结果,但是显式的将输入看作一个body片段可以确保用户输入的任何糟糕的HTML解析成body元素。
Document.body()方法能够检索文档对象中body元素的所有子元素,它相当于doc.getElementsByTag("body")

安全保证

如果需要接受来自用户输入的HTML,需要小心的避免跨站点脚本(cross-site)攻击。利用基于Whitelist的清除器和clean(String bodyHtml, Whitelist whitelist)方法来清除用户输入的恶意内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值