Java 修复HTML标签

开源的组件:http://sourceforge.net/projects/jtidy/

网站:http://jtidy.sourceforge.net/

 

可以自动修复HTML文本中的标签问题。

 

代码如下:

 

 

import java.io.StringReader;

 

import org.w3c.tidy.Tidy;

 

public class JtidyTest {

 

public static void main(String[] args) {

Tidy tidy = new Tidy(); // obtain a new Tidy instance

tidy.setXHTML(true); // set desired config options using tidy setters 

tidy.setInputEncoding("utf8");

tidy.setShowWarnings(false);

        tidy.setWraplen(1024);

        tidy.setSmartIndent(true);

        tidy.setQuiet(true);

        tidy.setPrintBodyOnly(true);

        tidy.setOutputEncoding("utf8");

StringReader  sr = new StringReader("<div>这是文本<div>");

tidy.parse(sr, System.out); // run tidy, providing an input and output stream

sr = new StringReader("<div><p>这是文本</div>");

tidy.parse(sr, System.out); 

}

}

 

输出内容如下:

 

 

<div>这是文本</div>

<div>

  <p>这是文本</p>

</div>


看到了吧,自动修复了没有闭合的标签
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值