XML标签中含非法字符的处理笔记

一、问题描述: 

首先,在XML中写下如下标签<sql></sql>,其中包含一个SQL ,SQL中含有小于号"<" 。

<sql>select * from t1 where dt < 1</sql>

然后提示错误信息:The content of elements must consist of well-formed character data or markup.

二、原因:

XML CDATA使用说明中说:“所有 XML 文档中的文本均会被解析器解析。只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。”

因此,XML默认会将"where dt < 1" 中的"<"解析成标签的一部分(解析器会把它解释为新元素的开始),被认为是不完整的标签,提示错误。

 

三、解决方法:

1.将非法的 XML 字符替换为实体引用。

<sql>select * from t1 where dt &lt; 1</sql>

(XML 中的 5 个预定义的实体引用,如下表)

&lt;<小于号
&gt;>大于号
&amp;&
&apos;单引号
&quot;"双引号

2. 使用CDATA区段。"<![CDATA[]]>"

<sql>
    <![CDATA[
    select * from t1 where dt < 1
    ]]>
</sql>

使用CDATA的注意事项: 

CDATA 部分不能包含字符串 "]]>"。也不允许嵌套的 CDATA 部分。

标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。

注:在使用Java或Python对XML解析时,标签中增加的CDATA不影响解析代码。 

四、参考链接:

XML CDATA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值