本文章内容转载自 W3school PCDATA 和 CDATA
PCDATA
PCDATA 指的是会被解析器解析的字符数据(Parsed Character Data)。
XML 解析器通常会解析 XML 文档中所有的文本。
当某个 XML 元素被解析时,其标签之间的文本也会被解析:
<message>此文本也会被解析</message>
解析器之所以这么做是因为 XML 元素可以包含其他元素,如下例子中 <name> 元素包含另外两个元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器会把它分解为像这样的子元素:
<name>
<first>Bill</first>
<last>Gates</last>
</name>
CDATA
CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。
在 XML 元素中,“<” 和 “&” 是非法的。
"<" 会产生错误,因为解析器会把 "<" 解释为新元素的开始。
"&" 也会产生错误,因为解析器会把 "&" 解释为字符实体的开始。
某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。
为了避免错误,可以将 JavaScript 代码定义为 CDATA。
CDATA 部分由 "<![CDATA["
开始,由 "]]>"
结束:
<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>
在上面的例子中,解析器会忽略 CDATA 部分中的所有内容。
注:
- CDATA 部分不允许嵌套
- CDATA 部分不能包含字符串 “]]>”
- CDATA 部分结尾的 “]]>” 不能包含空格或换行