wap应用需要注意的XML非法字符问题

做产品的bug修复中发现如果邮件主题出现一些特殊字符,会导致手机模拟器无法打开网页,xml无法被正常解析。

第一步分析以为是转义字符引起的xml标签不对称,对邮件主题加CDATA标签,重启服务后,问题仍然出现。



经过查找资料, 发现是XML文件中包含了一些不允许在XML中使用的字符(控制符). XML规范中规定了允许的字符范围(http://www.w3.org/TR/REC-xml#dt-character):

Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]



所以这类以xml为内容载体的wap内容格式,所有显示内容都需隔绝除上述范围的编码值,否则会产生严重的功能障碍。在邮件主题和内容的标签加上如下处理:



/**

* 使用空格替代非法字符.

*

* @param text

* @return

*/

public static String replaceInvaldateCharacter(String text)

{

if (text != null) {

char[] data = text.toCharArray();

for (int i = 0; i < data.length; i++) {

if(!isXMLCharacter( data[i])){

data[i] = 0x20;

}

}

return new String(data);

}

return text;

}



/**

* 检查字符是否为合法的xml字符。

* XML规范中规定了允许的字符范围(http://www.w3.org/TR/REC-xml#dt-character):

* Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]

*

* @param c

* @return

*/

private static boolean isXMLCharacter(int c)

{



if (c <= 0xD7FF) {

if (c >= 0x20) {

return true;

}

else {

return c == '\n' || c == '\r' || c == '\t';

}

}



return (c>=0xE000 && c<= 0xFFFD) || (c>=0x10000 && c<= 0x10FFFF);

}



经过非法字符的替换处理后,包含非法XML字符的邮件可以正常阅读。

综上所述,对于wml出现的内容,需要做以下处理:

1、 替换非法的XML字符

2、对于可能出现’<’,’/’,’&’,’>’等字符的内容需要进行转义字符替换,或者使用CDATA包起来
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值