java jtidy_java – 如何使JTIdy使HTML文档格式良好?

我正在使用JTidy v.r938.我正在使用此代码尝试清理页面…

final Tidy tidy = new Tidy();

tidy.setQuiet(false);

tidy.setShowWarnings(true);

tidy.setShowErrors(0);

tidy.setMakeClean(true);

Document document = tidy.parseDOM(conn.getInputStream(),null);

保持为

而不是“< / Meta>”标记或显示为“< Meta http-equiv =”Content-Type“content =”text / html;字符集= UTF-8 “/>” 中.我通过将生成的JTidy org.w3c.dom.Document输出为String来确认这一点.

我能做些什么才能让JTidy真正清理页面 – 即使其格式正确?我意识到还有其他工具,但这个问题与使用JTIdy有关.

403_19@

如果需要XML格式,则需要为Tidy指定几个标志

private String cleanData(String data) throws UnsupportedEncodingException {

Tidy tidy = new Tidy();

tidy.setInputEncoding("UTF-8");

tidy.setOutputEncoding("UTF-8");

tidy.setWraplen(Integer.MAX_VALUE);

tidy.setPrintBodyOnly(true);

tidy.setXmlOut(true);

tidy.setSmartIndent(true);

ByteArrayInputStream inputStream = new ByteArrayInputStream(data.getBytes("UTF-8"));

ByteArrayOutputStream outputStream = new ByteArrayOutputStream();

tidy.parseDOM(inputStream,outputStream);

return outputStream.toString("UTF-8");

}

或者只是想要XHTML表单

Tidy tidy = new Tidy();

tidy.setXHTML(true);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值