XML 非法字符

在写入或读取XML 文件时,需要注意对非法字符的过滤


根据W3C的标准,以下16进制的字符是不被允许出现在XML文件中的,即使放在<![CDATE[]]> 中,也不能幸免遇难

//x00-//x08
//x0b-//x0c
//x0e-//x1f

所以,需要对在这3个范围段的字符进行排除

可利用.NET中 Regex的 Replace 方法对字符串中在这3个范围段的字符进行替换,如:

string content = "as fas fasfadfasdfasdf<234234546456";

content = Regex.Replace(content, "[//x00-//x08//x0b-//x0c//x0e-//x1f]", "*");

Response.Write(content);

这样就OK了,如果你还不放心,可以对 <,>,&,'," 这5个符号进行一下特殊处理,即:
<    &lt; 
>    &gt;   
&    &amp;    
'    &apos; 
"    &quot;

 

 

Java处理代码


/** 
     * 使用d替代非法字符. 
     * @param text
     * @param d 
     * @return 
     */  
    public static String replaceInvaldateCharacter(String text, char d) {  
        if (text != null) {  
            char[] data = text.toCharArray();  
            for (int i = 0; i < data.length; i++) {  
                if(!isXMLCharacter(data[i])) 
                    data[i] = d;  
            }  
            return new String(data);  
        }  
        return "";  
    }  
     
    /** 
     * 使用空格替代非法字符. 
     * @param text
     * @return 
     */  
    public static String replaceInvaldateCharacter(String text) {  
        return replaceInvaldateCharacter(text, (char)0x20); 
    }  
     
    /** 
     * 检查字符是否为合法的xml字符
     * XML规范中规定了允许的字符范围(http://www.w3.org/TR/REC-xml#dt-character): 
     * Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] 
     * @param c 
     * @return 
     */  
    private static boolean isXMLCharacter(int c) { 
        if (c <= 0xD7FF) {  
            if (c >= 0x20)  
                return true;  
            else   
                return c == '/n' ||  c == '/r' || c == '/t';  
        }  
        return (c>=0xE000 && c<= 0xFFFD) || (c>=0x10000 && c<= 0x10FFFF);  
    }  
 
经过非法字符的替换处理后,包含非法XML字符的邮件可以正常阅读。
综上所述,对于wml出现的内容,需要做以下处理:
1、替换非法的XML字符
2、对于可能出现’<’,’/’,’&’,’>’等字符的内容需要进行转义字符替换,或者使用CDATA包起来

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值