XML与XML 命名空间(Namespaces)
首先,XML命名空间并不是XML 1.0标准的一部分,而是一个被称为“Namespace in XML”的独立标准。W3C组织于1998年2月提出XML命名空间标准的第一个草案,直到1999年1月14日才正式发布为推荐标准。
XML命名空间的由来
简单说来,制定XML命名空间标准的初衷是为了解决XML文档中命名的冲突问题。
在XML的实际应用中,人们常常为不同行业和领域用XML制定不同的语言标准,比如电子商务、远程教育、电子书都分别用XML制定了语言标准,然后针对不同的语言编写不同的模块化处理程序。通过重用现存的语言标准和处理程序,人们可以很快地定义出新的语言标准和处理程序。假如我们通过重新命名的方法解决名称冲突问题,那么我们将面临着,针对原名称开发的应用程序不可再利用的危险。
解决名称冲突的一个比较好的解决方案是,给不同的语言赋以不同的名称空间,应用程序通过名称空间来区分一个元素到底来自于哪一个语言。 XML命名空间就是对这种方案的具体实现。
XML命名空间的定义
XML命名空间解决命名冲突问题采用的方法是所谓“两段式命名法”,其中第一段是代表特定命名空间的“命名空间前缀”,第二段是元素或属性原来的名字,两段之间用冒号“:”分开。
下面我们就对XML命名空间的定义做一说明。XML命名空间的定义由命名空间的声明、“合法名称”的定义及应用、命名空间的作用域三部分组成。
1.XML命名空间的声明
<学生:学生 xmlns:学生 = http://www.xml.net.cn/学生
xmlns:班主任 = http://www.xml.net.cn/班主任>
就是命名空间声明。
命名空间声明有两种方式,即直接定义方式和缺省定义方式:
直接定义方式:
xmlns: [命名空间前缀] = [命名空间名]
缺省定义方式:
xmlns = [命名空间名]
命名空间声明中,等号右边的属性值部分是一个URI(Uniform Resource Identifier统一资源标识符)引用,其功能是区分不同的命名空间。因此,这个URI引用被称为命名空间名,它应该具有唯一性和持久性。虽然该属性值使用了URI,但其目的并不是要直接得到一个Schema或DTD,主要的目的在于标识特定的命名空间。
命名空间声明中,等号左边的属性名部分,如果有用冒号“:”分隔开的“命名空间前缀”,就是直接定义方式,其中“命名空间前缀”是一个合法的XML名称。没有“命名空间前缀”的命名空间声明,就是缺省的命名空间声明。 命名空间声明将“命名空间名”与“命名空间前缀”绑定在一起。
2. “合法名称”的定义和应用
在定义了命名空间的声明以后,对如何引用<命名空间前缀>构成新的元素名和属性名,需要再做进一步的统一规范,这就是所谓“合法名称”定义的由来。
“合法名称”由用西文冒号“:”分开的前缀部分和本地部分组成,其中前缀部分和本地部分都是一个合法的XML名称。如:“班主任:姓名”。
“合法名称”的前缀部分,规定必须是一个“命名空间前缀”,且这个命名空间前缀必须已经经过命名空间声明声明过,语法分析器会自动将其与声明中的URI引用相联系。冒号后的部分是该命名空间中定义的元素或属性名,提供了“合法名称”的本地部分。在用缺省方式声明命名空间时,由于“命名空间前缀”为空,因此,这时的“合法名称”只剩下本地部分。
“合法名称”的应用主要有三种情况:
用于起始元素标记、结束元素标记和空元素标记。
用于属性的定义。例如:
<?xml version ="1.0" encoding = "GB2312"?>
<学生:学生 xmlns:学生 = http://www.xml.net.cn/学生>
<学生:姓名>李明</学生:姓名>
<学生:班级 学生:数字类型 = "中文">三年级二班</学生:班级>
<学生:住址 学生:数字类型 = "阿拉伯">135楼210室</学生:住址>
</学生:学生>
用于DTD中的元素名和属性类型。例如:
<?xml version="1.0" encoding="GB2312"?>
<!ELEMENT 学生:学生 (学生:姓名, 学生:班级,学生:住址)>
<!ATTLIST 学生:学生 xmlns:学生
CDATA #FIXED "http://www.xml.net.cn/学生">
<!ELEMENT 学生:姓名 (#PCDATA)>
<!ELEMENT 学生:班级 (#PCDATA)>
<!ELEMENT 学生:住址 (#PCDATA)>
3.命名空间的作用域
所谓命名空间的作用域范围是指,一个命名空间声明可以作用到哪些元素和属性。一般可以认为命名空间声明,能够作用到说明它的元素和该元素的所有内容元素,除非被其他命名空间声明所覆盖。
与XML命名空间相关的主要概念,讨论到这里基本上可以结束了。
XML命名空间已经在XSLT、Xlink等标准中得到应用,它已经成为XML标准家族不可或缺的一员。
XML 命名空间提供了一种避免元素命名冲突的方法。
--------------------------------------------------------------------------------
命名冲突
因为XML文档中使用的元素不是固定的,那么两个不同的XML文档使用同一个名字来描述不同类型的元素的情况就可能发生。而这种情况又往往会导致命名冲突。请看下面两个例子
这个 XML 文档在table元素中携带了水果的信息:
<table>
<tr>
<td>Apples</td>
<td>Bananas</td>
</tr>
</table>
这个 XML 文档在table元素中携带了桌子的信息(家具,不能吃的哦):
<table>
<name>African Coffee Table</name>
<width>80</width>
<length>120</length>
</table>
如果上面两个XML文档片断碰巧在一起使用的话,那么将会出现命名冲突的情况。因为这两个片断都包含了<table>元素,而这两个table元素的定义与所包含的内容又各不相同。
--------------------------------------------------------------------------------
使用前缀解决命名冲突问题
下面的XML文档在table元素中携带了信息:
<h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
下面的XML文档携带了家具table的信息:
<f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
现在已经没有元素命名冲突的问题了,因为这两个文档对各自的table元素使用了不同的前缀,table元素在两个文档中分别是(<h:table> 和<f:table>)。
通过使用前缀,我们创建了两个不同的table元素。
--------------------------------------------------------------------------------
使用命名空间
下面的XML文档在table元素中携带了信息:
程序代码
下面的XML文档携带了家具table的信息:
程序代码
在上面两个例子中除了使用前缀外,两个table元素都使用了xmlns属性,使元素和不同的命名空间关联到一起。
--------------------------------------------------------------------------------
命名空间属性
命名空间属性一般放置在元素的开始标记处,其使用语法如下所示:
xmlns:namespace-prefix="namespace"
在上面的例子中,命名空间定义了一个Internet 地址:
xmlns:f="http://www.w3schools.com/furniture"
W3C 命名规范声明命名空间本身就是一个统一资源标示符,Uniform Resource Identifier (URI)。
当我们在元素的开始标记处使用命名空间时,该元素所有的子元素都将通过一个前缀与同一个命名空间相互关联。
注意:用来标识命名空间的网络地址并不被XML解析器调用,XML解析器不需要从这个网络地址中查找信息,该网络地址的作用仅仅是给命名空间一个唯一的名字,因此这个网络地址也可以是虚拟的,然而又很多公司经常把这个网络地址值象一个真实的Web页面,这个地址包含了关于当前命名空间更详细的信息。
可以访问http://www.w3.org/TR/html4/.
--------------------------------------------------------------------------------
统一资源标识符
通用资源标识符(A Uniform Resource Identifier (URI))是一个标识网络资源的字符串。最普通的URI应该是统一资源定位符Uniform Resource Locator (URL)。URL用于标识网络主机的地址。另一方面,另一个不常用的URI是通用资源名字Universal Resource Name (URN)。在我们的例子中,一般使用的是URLs。
既然前面的例子使用的URL地址来标识命名空间,我们可以确信这个命名空间是唯一的。
--------------------------------------------------------------------------------
默认的命名空间
定义一个默认的XML命名空间使得我们在子元素的开始标记中不需要使用前缀。他的语法如下所示:
<element xmlns="namespace">
下面的XML文档在table元素中包含了水果的信息:
程序代码
下面的XML文档包含了家具table的信息:
程序代码
--------------------------------------------------------------------------------
使用命名空间
档开始使用XSL的时候,就会发现命名空间使用的是如此频繁。XSL样式单主要用于将XML文档转换成类似于HTML文件的格式。
如果看一下下面的XSL文档,就会发现有很多标记都是HTML标记。那些标记并不是HTML标记,是加了前缀的XSL,这个XSL前缀由命名空间"http://www.w3.org/TR/xsl"所标识:
程序代码
W3C 与 XML 命名空间
XML 命名空间提供了一个通过与由 URI 引用确定的命名空间相联系的简单方法来保证在可扩展标注语言(XML)文档中的元素和属性名字的合法性。
让我们设想一个可扩展标注语言(XML)的应用:一个 XML 文件可以包含许多元素和属性(这里亦被称为"标注词汇"),这些元素和属性由多个软件模块定义并使用。这里的一个动机就是模块化,假如有一种这样标注词汇, 既好理解又有可供它使用的软件,那么重复使用这种标注就胜于再创建一个。
像这样包含着多重标注词汇的文件,看上去会造成识别上的问题和冲突。软件模块是设计用于处理这些标签(tags)及属性的需要能够识别这些标签(tags)及属性, 即便在碰到那些本来为其它软件包设计的标注使用相同元素类型或属性名所产生的冲突时也要如此。
基於这些考虑,文件结构中应含有通用名,它的界限延伸到所包含文件范围之外。本文将描述一种实现这点的机制,XML 命名空间。
[定义:一个XML 命名空间是一个命名的汇集,它由 URI 引用[RFC2396]确定,在 XML 文件中做为元素类型和属性名使用]。XML 版本拥有内在结构,而且,从数学上来说不是一个集合,因此, XML 命名空间有别于传统上在计算学科中使用的命名空间。这些将在A XML命名空间的内部结构中讨论。
[定义:假如每个字符都确切相同的话,确定命名空间的 URI 引用可被认为相同。]注意在这一意义上不相同的引用也可能在功能上等同。比如,只存在大小写上不同的 URI 引用,或者有执行不同基准 URIs 的外部实体的 URI 引用。
来自于命名空间的命名可做为合法名 Qname 出现,该合法名包含一个把命名分为一个命名空间前缀和一个局域部分的冒号。与 URI 引用成映象的前缀选择了命名空间。统一管理的命名空间和文件自己的命名空间的联合生成了一个通用的唯一的标志符。对前缀范围和缺省也提供相应的机制。
URI 引用可包含一些在命名中所不允许的字符,所以不能直接作为命名空间前缀来使用。因此,命名空间前缀提供了一个引用代理服务。下面将描述的基於属性的语法用来声明命名空间前缀和 URI 引用的关系,支持这种命名空间设计的软件必须识别并按这些声明和前缀行动。
首先,XML命名空间并不是XML 1.0标准的一部分,而是一个被称为“Namespace in XML”的独立标准。W3C组织于1998年2月提出XML命名空间标准的第一个草案,直到1999年1月14日才正式发布为推荐标准。
XML命名空间的由来
简单说来,制定XML命名空间标准的初衷是为了解决XML文档中命名的冲突问题。
在XML的实际应用中,人们常常为不同行业和领域用XML制定不同的语言标准,比如电子商务、远程教育、电子书都分别用XML制定了语言标准,然后针对不同的语言编写不同的模块化处理程序。通过重用现存的语言标准和处理程序,人们可以很快地定义出新的语言标准和处理程序。假如我们通过重新命名的方法解决名称冲突问题,那么我们将面临着,针对原名称开发的应用程序不可再利用的危险。
解决名称冲突的一个比较好的解决方案是,给不同的语言赋以不同的名称空间,应用程序通过名称空间来区分一个元素到底来自于哪一个语言。 XML命名空间就是对这种方案的具体实现。
XML命名空间的定义
XML命名空间解决命名冲突问题采用的方法是所谓“两段式命名法”,其中第一段是代表特定命名空间的“命名空间前缀”,第二段是元素或属性原来的名字,两段之间用冒号“:”分开。
下面我们就对XML命名空间的定义做一说明。XML命名空间的定义由命名空间的声明、“合法名称”的定义及应用、命名空间的作用域三部分组成。
1.XML命名空间的声明
<学生:学生 xmlns:学生 = http://www.xml.net.cn/学生
xmlns:班主任 = http://www.xml.net.cn/班主任>
就是命名空间声明。
命名空间声明有两种方式,即直接定义方式和缺省定义方式:
直接定义方式:
xmlns: [命名空间前缀] = [命名空间名]
缺省定义方式:
xmlns = [命名空间名]
命名空间声明中,等号右边的属性值部分是一个URI(Uniform Resource Identifier统一资源标识符)引用,其功能是区分不同的命名空间。因此,这个URI引用被称为命名空间名,它应该具有唯一性和持久性。虽然该属性值使用了URI,但其目的并不是要直接得到一个Schema或DTD,主要的目的在于标识特定的命名空间。
命名空间声明中,等号左边的属性名部分,如果有用冒号“:”分隔开的“命名空间前缀”,就是直接定义方式,其中“命名空间前缀”是一个合法的XML名称。没有“命名空间前缀”的命名空间声明,就是缺省的命名空间声明。 命名空间声明将“命名空间名”与“命名空间前缀”绑定在一起。
2. “合法名称”的定义和应用
在定义了命名空间的声明以后,对如何引用<命名空间前缀>构成新的元素名和属性名,需要再做进一步的统一规范,这就是所谓“合法名称”定义的由来。
“合法名称”由用西文冒号“:”分开的前缀部分和本地部分组成,其中前缀部分和本地部分都是一个合法的XML名称。如:“班主任:姓名”。
“合法名称”的前缀部分,规定必须是一个“命名空间前缀”,且这个命名空间前缀必须已经经过命名空间声明声明过,语法分析器会自动将其与声明中的URI引用相联系。冒号后的部分是该命名空间中定义的元素或属性名,提供了“合法名称”的本地部分。在用缺省方式声明命名空间时,由于“命名空间前缀”为空,因此,这时的“合法名称”只剩下本地部分。
“合法名称”的应用主要有三种情况:
用于起始元素标记、结束元素标记和空元素标记。
用于属性的定义。例如:
<?xml version ="1.0" encoding = "GB2312"?>
<学生:学生 xmlns:学生 = http://www.xml.net.cn/学生>
<学生:姓名>李明</学生:姓名>
<学生:班级 学生:数字类型 = "中文">三年级二班</学生:班级>
<学生:住址 学生:数字类型 = "阿拉伯">135楼210室</学生:住址>
</学生:学生>
用于DTD中的元素名和属性类型。例如:
<?xml version="1.0" encoding="GB2312"?>
<!ELEMENT 学生:学生 (学生:姓名, 学生:班级,学生:住址)>
<!ATTLIST 学生:学生 xmlns:学生
CDATA #FIXED "http://www.xml.net.cn/学生">
<!ELEMENT 学生:姓名 (#PCDATA)>
<!ELEMENT 学生:班级 (#PCDATA)>
<!ELEMENT 学生:住址 (#PCDATA)>
3.命名空间的作用域
所谓命名空间的作用域范围是指,一个命名空间声明可以作用到哪些元素和属性。一般可以认为命名空间声明,能够作用到说明它的元素和该元素的所有内容元素,除非被其他命名空间声明所覆盖。
与XML命名空间相关的主要概念,讨论到这里基本上可以结束了。
XML命名空间已经在XSLT、Xlink等标准中得到应用,它已经成为XML标准家族不可或缺的一员。
XML 命名空间提供了一种避免元素命名冲突的方法。
--------------------------------------------------------------------------------
命名冲突
因为XML文档中使用的元素不是固定的,那么两个不同的XML文档使用同一个名字来描述不同类型的元素的情况就可能发生。而这种情况又往往会导致命名冲突。请看下面两个例子
这个 XML 文档在table元素中携带了水果的信息:
<table>
<tr>
<td>Apples</td>
<td>Bananas</td>
</tr>
</table>
这个 XML 文档在table元素中携带了桌子的信息(家具,不能吃的哦):
<table>
<name>African Coffee Table</name>
<width>80</width>
<length>120</length>
</table>
如果上面两个XML文档片断碰巧在一起使用的话,那么将会出现命名冲突的情况。因为这两个片断都包含了<table>元素,而这两个table元素的定义与所包含的内容又各不相同。
--------------------------------------------------------------------------------
使用前缀解决命名冲突问题
下面的XML文档在table元素中携带了信息:
<h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
下面的XML文档携带了家具table的信息:
<f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
现在已经没有元素命名冲突的问题了,因为这两个文档对各自的table元素使用了不同的前缀,table元素在两个文档中分别是(<h:table> 和<f:table>)。
通过使用前缀,我们创建了两个不同的table元素。
--------------------------------------------------------------------------------
使用命名空间
下面的XML文档在table元素中携带了信息:
![程序代码](http://www.ad0.cn/netfetch/images/code.gif)
<h:table xmlns:h="
http://www.w3.org/TR/html4/">
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
下面的XML文档携带了家具table的信息:
![程序代码](http://www.ad0.cn/netfetch/images/code.gif)
<f:table xmlns:f="
http://www.w3schools.com/furniture">
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
在上面两个例子中除了使用前缀外,两个table元素都使用了xmlns属性,使元素和不同的命名空间关联到一起。
--------------------------------------------------------------------------------
命名空间属性
命名空间属性一般放置在元素的开始标记处,其使用语法如下所示:
xmlns:namespace-prefix="namespace"
在上面的例子中,命名空间定义了一个Internet 地址:
xmlns:f="http://www.w3schools.com/furniture"
W3C 命名规范声明命名空间本身就是一个统一资源标示符,Uniform Resource Identifier (URI)。
当我们在元素的开始标记处使用命名空间时,该元素所有的子元素都将通过一个前缀与同一个命名空间相互关联。
注意:用来标识命名空间的网络地址并不被XML解析器调用,XML解析器不需要从这个网络地址中查找信息,该网络地址的作用仅仅是给命名空间一个唯一的名字,因此这个网络地址也可以是虚拟的,然而又很多公司经常把这个网络地址值象一个真实的Web页面,这个地址包含了关于当前命名空间更详细的信息。
可以访问http://www.w3.org/TR/html4/.
--------------------------------------------------------------------------------
统一资源标识符
通用资源标识符(A Uniform Resource Identifier (URI))是一个标识网络资源的字符串。最普通的URI应该是统一资源定位符Uniform Resource Locator (URL)。URL用于标识网络主机的地址。另一方面,另一个不常用的URI是通用资源名字Universal Resource Name (URN)。在我们的例子中,一般使用的是URLs。
既然前面的例子使用的URL地址来标识命名空间,我们可以确信这个命名空间是唯一的。
--------------------------------------------------------------------------------
默认的命名空间
定义一个默认的XML命名空间使得我们在子元素的开始标记中不需要使用前缀。他的语法如下所示:
<element xmlns="namespace">
下面的XML文档在table元素中包含了水果的信息:
![程序代码](http://www.ad0.cn/netfetch/images/code.gif)
下面的XML文档包含了家具table的信息:
![程序代码](http://www.ad0.cn/netfetch/images/code.gif)
<table xmlns="
http://www.w3schools.com/furniture">
<name>African Coffee Table</name>
<width>80</width>
<length>120</length>
</table>
<name>African Coffee Table</name>
<width>80</width>
<length>120</length>
</table>
--------------------------------------------------------------------------------
使用命名空间
档开始使用XSL的时候,就会发现命名空间使用的是如此频繁。XSL样式单主要用于将XML文档转换成类似于HTML文件的格式。
如果看一下下面的XSL文档,就会发现有很多标记都是HTML标记。那些标记并不是HTML标记,是加了前缀的XSL,这个XSL前缀由命名空间"http://www.w3.org/TR/xsl"所标识:
![程序代码](http://www.ad0.cn/netfetch/images/code.gif)
<?xml version="1.0" encoding="ISO-8859-1"?>
<xsl:stylesheet xmlns:xsl=" http://www.w3.org/TR/xsl">
<xsl:template match="/">
<html>
<body>
<table border="2" bgcolor="yellow">
<tr>
<th>Title</th>
<th>Artist</th>
</tr>
<xsl:for-each select="CATALOG/CD">
<tr>
<td><xsl:value-of select="TITLE"/></td>
<td><xsl:value-of select="ARTIST"/></td>
</tr>
</xsl:for-each>
</table>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
<xsl:stylesheet xmlns:xsl=" http://www.w3.org/TR/xsl">
<xsl:template match="/">
<html>
<body>
<table border="2" bgcolor="yellow">
<tr>
<th>Title</th>
<th>Artist</th>
</tr>
<xsl:for-each select="CATALOG/CD">
<tr>
<td><xsl:value-of select="TITLE"/></td>
<td><xsl:value-of select="ARTIST"/></td>
</tr>
</xsl:for-each>
</table>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
W3C 与 XML 命名空间
XML 命名空间提供了一个通过与由 URI 引用确定的命名空间相联系的简单方法来保证在可扩展标注语言(XML)文档中的元素和属性名字的合法性。
让我们设想一个可扩展标注语言(XML)的应用:一个 XML 文件可以包含许多元素和属性(这里亦被称为"标注词汇"),这些元素和属性由多个软件模块定义并使用。这里的一个动机就是模块化,假如有一种这样标注词汇, 既好理解又有可供它使用的软件,那么重复使用这种标注就胜于再创建一个。
像这样包含着多重标注词汇的文件,看上去会造成识别上的问题和冲突。软件模块是设计用于处理这些标签(tags)及属性的需要能够识别这些标签(tags)及属性, 即便在碰到那些本来为其它软件包设计的标注使用相同元素类型或属性名所产生的冲突时也要如此。
基於这些考虑,文件结构中应含有通用名,它的界限延伸到所包含文件范围之外。本文将描述一种实现这点的机制,XML 命名空间。
[定义:一个XML 命名空间是一个命名的汇集,它由 URI 引用[RFC2396]确定,在 XML 文件中做为元素类型和属性名使用]。XML 版本拥有内在结构,而且,从数学上来说不是一个集合,因此, XML 命名空间有别于传统上在计算学科中使用的命名空间。这些将在A XML命名空间的内部结构中讨论。
[定义:假如每个字符都确切相同的话,确定命名空间的 URI 引用可被认为相同。]注意在这一意义上不相同的引用也可能在功能上等同。比如,只存在大小写上不同的 URI 引用,或者有执行不同基准 URIs 的外部实体的 URI 引用。
来自于命名空间的命名可做为合法名 Qname 出现,该合法名包含一个把命名分为一个命名空间前缀和一个局域部分的冒号。与 URI 引用成映象的前缀选择了命名空间。统一管理的命名空间和文件自己的命名空间的联合生成了一个通用的唯一的标志符。对前缀范围和缺省也提供相应的机制。
URI 引用可包含一些在命名中所不允许的字符,所以不能直接作为命名空间前缀来使用。因此,命名空间前缀提供了一个引用代理服务。下面将描述的基於属性的语法用来声明命名空间前缀和 URI 引用的关系,支持这种命名空间设计的软件必须识别并按这些声明和前缀行动。