XML中特殊字符的处理方式

项目中需要解析XML,发现如果包含一些特殊字符,使用DocumentHelper.parseText(xmlString)这个方法时会报错,原因是在 XML 元素中,"<" 和 "&" 是非法的。

"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

度娘了一下解决方法大致有两种:

一、对XML字符串中的特殊字符进行转义,代码如下:

	
	/** 
	  * 替换一个字符串中的某些指定字符 
	  * @param strData String 原始字符串 
	  * @param regex String 要替换的字符串 
	  * @param replacement String 替代字符串 
	  * @return String 替换后的字符串 
	  */  
	 public static String replaceString(String strData, String regex,  
	         String replacement)  
	 {  
	     if (strData == null)  
	     {  
	         return null;  
	     }  
	     int index;  
	     index = strData.indexOf(regex);  
	     String strNew = "";  
	     if (index >= 0)  
	     {  
	         while (index >= 0)  
	         {  
	             strNew += strData.substring(0, index) + replacement;  
	             strData = strData.substring(index + regex.length());  
	             index = strData.indexOf(regex);  
	         }  
	         strNew += strData;  
	         return strNew;  
	     }  
	     return strData;  
	 }  
	  
	 /** 
	  * 替换字符串中特殊字符 
	  */  
	public static String encodeString(String strData)  
	 {  
	     if (strData == null)  
	     {  
	         return "";  
	     }  
	     strData = replaceString(strData, "&", "&");  
	     strData = replaceString(strData, "<", "<");  
	     strData = replaceString(strData, ">", ">");  
	     strData = replaceString(strData, "'", "'");  
	     strData = replaceString(strData, "\"", """);  
	     return strData;  
	 }  
	  
	 /** 
	  * 还原字符串中特殊字符 
	  */  
	public static String decodeString(String strData)  
	 {  
	     strData = replaceString(strData, "<", "<");  
	     strData = replaceString(strData, ">", ">");  
	     strData = replaceString(strData, "'", "'");  
	     strData = replaceString(strData, """, "\"");  
	     strData = replaceString(strData, "&", "&");  
	     return strData;  
	 }  
	

二、采用 CDATA 

术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)

如果文本包含了很多的"<"字符和"&"字符,那么最好把他们都放到CDATA部件中。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束

可以参考

代码如下:

<script><![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } ]]></script>






  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值