jsoup html转义,html Jsoup压缩特殊字符_character-encoding_开发99编程知识库

除了在 HTTP header 中指定的任何字符集之外,這裡不涉及任何字符集。String check ="

isn’t

".replaceAll("&([^;]+?);","**$1;");

Document doc = Jsoup.parse(check);

doc.outputSettings().prettyPrint(false).escapeMode(EscapeMode.extended);

System.out.println(doc.outerHtml().replaceAll("**([^;]+?);","&$1;"));

輸出

isn’t

討論

我希望在jsoup的API中有一個解決方案- -

使用 jsoup'要求你編寫定製的NodeVisitor 。 它將導致( re ) 發明一些現有的代碼 inside Jsoup 。 定製Nodevisitor將生成一個HTML轉義碼而不是unicode字元。

另一個選項是編寫自定義字元編碼器。 默認的UTF-8 字元編碼器可以編碼 ’ 。 這就是為什麼Jsoup不在最終的HTML代碼中保留原來的轉義順序。

這兩個 上面 選項中的任何一個都代表著一個大的編碼工作。 最終,可以將增強添加到Jsoup中,以便我們選擇如何在最終的HTML代碼中生成字元: 十六進位轉義( AB; ),十進位轉義( ),原始轉義序列( ’ ) 或者寫入編碼字元( 你的文章中的情況是) 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值