xml中的特殊字符

原创 2012年03月22日 16:17:20

在XML中,有一些符号作为XML 的标记符号,一些特定情况下,属性值必须带有这些特殊符号。 下面主要是讲解一些常用的特殊符号的处理

例一: 双引号的使用。

双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

<add key="IPhone" value="apple"/>  ...属性值为 ("apple").

解决:  <add key="IPhone" value=’"apple"‘/>

b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

<add key="IPhone" value="&quot;&apos;apple&quot;"/> 

下表为 XML 标记使用的字符列出了五种内置实体。

实体 实体引用 含义

lt

&lt;

<(小于号)

gt

&gt;

>(大于号)

amp

&amp;

&(“and”符)

apos

&apos;

'(撇号或单引号)

quot

&quot;

"(双引号)

如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos;&quot; 实体引用最常用在属性值中。

 

在做WebServices时为了实现复杂数据的传输,我们经常会采用XML格式的字符串来传送,这主要是由于XML具有存取数据,跨平台及跨语言等好处。请看下面例子:

  public String getAllNewSpace() {
  StringBuffer toClient = new StringBuffer("<root>");
  if (null != dataset) {
  while (dataset.next()) {
  toClient.append("<User>");
  toClient.append("<UserName>"); //<![CDATA[
  toClient.append(dataset.getString(1));
  toClient.append("</UserName>"); //]]
  toClient.append("<UserId>");
  toClient.append(dataset.getString(2));
  toClient.append("</UserId>");
  toClient.append("</User>");
  }
  }
  toClient.append("</root>");
  return toClient.toString();
  }

  如果<UserName>节点中含有“&”,“<”,“>”等字符时,解释此XML时会出错。

  可以有两种解决方法:

  一、 通过Xml Document对象得到XML字符串返回给客户端,不能直接把XmlDocument返回给客户端,因为Java中的Xml Document对象,别的语言是无法正确解释的,我们只能返回XML 字符串:

public String getAllNewSpace() {
  Document document = DocumentHelper.createDocument();
  Element root=document.addElement("root");
  if (null != dataset) {
  while (dataset.next()) {
  Element user=root.addElement("User");
  Element userName=user.addElement("UserName");
  userName.setText(dataset.getString(1));
  Element userId=user.addElement("UserId");
  userId.setText (dataset.getString(2));
  }
  }
  return document.asXML();
  }

  二、 给XML 字符串添加DTD验证:在节点值部份添加“<![CDATA[ ]]”

  public String getAllNewSpace() {
  StringBuffer toClient = new StringBuffer("<root>");
  if (null != dataset) {
  while (dataset.next()) {
  toClient.append("<User>");
  toClient.append("<UserName><![CDATA[");
  toClient.append(dataset.getString(1));
  toClient.append("]]</UserName>");
  toClient.append("<UserId>");
  toClient.append(dataset.getString(2));
  toClient.append("</UserId>");
  toClient.append("</User>");
  }
  }
  toClient.append("</root>");
  return toClient.toString();
  }

写ajax时最容易输出xml的就是拼凑字符串拉

如何处理特殊字符串是个问题

参见以下两种方法

http://webdev.csdn.net/page/96ba432b-af4a-412c-9684-2935c617faeb

对如我而言,我需要在html页面上显示的,我只需要把特殊字符串转为实体字符

&lt; < 小于号
&gt; > 大于号
&amp; &
&apos; ' 单引号
&quot; " 双引号

很显然 struts标签 bean:write 的属性 filter="true" 也是实现此功能

打开源代码,轻松找到这个方法 org.apache.struts.util。ResponseUtils.filter(String value)

具体实现如下:

public static String filter(String value)
    {
        if(value == null)
            return null;
        char content[] = new char[value.length()];
        value.getChars(0, value.length(), content, 0);
        StringBuffer result = new StringBuffer(content.length + 50);
        for(int i = 0; i < content.length; i++)
            switch(content[i])
            {
            case 60: // '<'
                result.append("&lt;");
                break;

            case 62: // '>'
                result.append("&gt;");
                break;

            case 38: // '&'
                result.append("&amp;");
                break;

            case 34: // '"'
                result.append("&quot;");
                break;

            case 39: // '\''
                result.append("&#39;");
                break;

            default:
                result.append(content[i]);
                break;
            }

        return result.toString();
    }

当然有时候写javascript还需要平凑html,然后用一句 obj.innerHTML=展示你的页面

这时候也需要处理特殊字符。

我也仿照bean:write标签写很土的一个js版本的filter方法吧

function  filter(v)
    {
        if(v == null||v=="")
            return "";
      var result="";
        for(var i = 0; i < v.length; i++)
            switch(v.charAt(i))
            {
            case "<": result+="&lt;";break;
            case ">": result+="&gt;"; break;
            case "&":result+="&amp;";break;
            case "\"": result+="&quot;";break;
            case "'": result+="&#39;";break;
            default:result+=v.charAt(i);break;
            }
        return result;
}

如果用到prototype框架里面也有个方法

escapeHTML: function() {
    return this.replace(/&/g,'&amp;').replace(/</g,'&lt;').replace(/>/g,'&gt;');
  }

转换回来的对应方法为unescapeHTML

例如

var temp="<>/";

alert(temp.escapeHTML());

版权声明:本文为博主原创文章,未经博主允许不得转载。

java xml 特殊字符处理(dom4j)

XML中共有5个特殊的字符,分别是:&特殊标签,将包含特殊字符的字符串封装起来;其二,使用XML转义序列表示这些特殊的字符,这5个特殊字符所对应XML转义序列在表4-2中说明:  Spring在进行...
  • dongfengkuayue
  • dongfengkuayue
  • 2015年12月09日 18:40
  • 5539

xml 转义特殊字符 如&'"

写了个request2XML的方法,每当数据中有'
  • lihualiu81
  • lihualiu81
  • 2011年03月08日 12:23
  • 63058

用Java过滤掉不能作为xml内容的特殊字符

背景 最近参与一个项目,需要从网页中抽取xml信息。在网页中,各种字符都是有可能出现的。 出现的一个问题是:我抽取出的信息直接作为xml文档的内容,导致xml文档不符合规范(用firefox打开会报...
  • xiaoyaoliuxiaoyao
  • xiaoyaoliuxiaoyao
  • 2014年03月03日 12:46
  • 2085

XML中输入特殊符号

在 XML 中有 5 个预定义的实体引用: < 小于 > > 大于 & & 和号 ' ' 省略号 " " 引号 注释:严格地讲,在...
  • GOon_star
  • GOon_star
  • 2015年11月04日 13:30
  • 6005

在xml中的一些特殊符号的使用如:> < &等等

在xml文档中,每当数据中有'This text is also parsed XML解析器这样做的原因是XML元素内部可能还包含了别的元素,象下面的例子,name元素内部包含了first和last...
  • wu920604
  • wu920604
  • 2017年07月11日 18:09
  • 1687

mybatis xml中特殊字符处理

mybatis xml中特殊字符处理
  • hbtj_1216
  • hbtj_1216
  • 2016年06月26日 16:15
  • 8768

xml中的特殊字符替换

  • 2009年12月16日 11:00
  • 712B
  • 下载

XML 文件中出现 & ® ™ 这类特殊字符的一种解决方法(from blog.joycode.com/ghj)

        这几天在跟一个公司合作的项目中,对方提供了RSS接口,通过这个接口,在我们网站展现出来,但是对方RSS中出现了一些麻烦的字符,比如 &,®,™  等。这些字符放到XML中,如果不做特殊...
  • gxh973121
  • gxh973121
  • 2004年12月15日 11:31
  • 1190

XML 特殊字符处理

在XML中,有一些符号作为XML 的标记符号,一些特定情况下,属性值必须带有这些特殊符号。 下面主要是讲解一些常用的特殊符号的处理 例一: 双引号的使用。 双引号作为XML 属性值的开始结束符...
  • ldl22847
  • ldl22847
  • 2011年12月01日 00:51
  • 36819

xml文件中特殊符号代替

今天在做自定义软件盘的时候,发现配置文件xml里面不能识别&这类的特殊符号,于是上网查了下资料,总结一下。希望对大家有帮助。 < > > 大于号   & & 和   &a...
  • nihaoabcd123
  • nihaoabcd123
  • 2016年03月23日 16:47
  • 253
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:xml中的特殊字符
举报原因:
原因补充:

(最多只允许输入30个字)