一直觉得XML中的CDATA与转义字符功能有重叠

在xml中,”<”、”>”、”&”等字符是不能直接存入的,否则xml语法检查时会报错,如果想在xml中使用这些符号,必须将其转义为实体,如”<”、”>”、”&”,这样才能保存进xml文档。
在XML中,需要转义的字符有:
  (1)&   &
  (2)<   <
  (3)>   >
  (4)"   "
  (5)'   '
  值得注意的是:
  (1)转义序列字符之间不能有空格;
  (2) 转义序列必须以”;”结束;
  (3) 单独出现的”&”不会被认为是转义的开始;
  (4) 区分大小写。
例如:
age < 30
  上面这种写法会报错,应该这样写:
   age < 30
  
转义前的字符也好,转义后的字符也好,都会被xml解析器解析
如果不想使用转义符号则需要使用到CDATA标记,<![CDATA[]]>表示xml解析器忽略解析:
所以被<![CDATA[]]>这个标记所包含的内容将表示为纯文本

例如:
age <![CDATA[<]]> 30
或者
<![CDATA[ age < 30 ]]>
值得注意的是:
  (1) 此部分不能再包含”]]>”;
  (2) 不允许嵌套使用;
  (3)”]]>”这部分不能包含空格或者换行。

他们的功能确实重复,不一样的点在于:
1:CDATA标志在首尾方便,容易看懂

2:CDATA会被忽略解析,parse起来快

3:如果字符串太短CDATA写起来有特别啰嗦
例如:一个文本节点出现大量的特殊字符(< > ’ " &等)时,使用实体引用使得文档变得更占存储;而使用CDATA只要在文本节点头尾加标识符即可。

4:但是CDATA不能适用所有情况,所以极端情况下还得靠转义
   情况1:实体引用可以出现在属性值,而CDATA不行。

<script a="a&lt;a"></script>

上面的属性值看似奇怪,但的确能被正确解析
  
   情况2:CDATA有局限,CDATA内部不能出现字符串 ]]>,在这种情况在还是要用实体引用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值