XML是可扩展的标记语言(eXtensible Markup Language)的缩写。标致记语言除了可以存储文档的基本信息外,还可以存储文档的显示格式、文档布局、逻辑结构等附加信息。
XML的可扩展性体现在其标记可以由开发者自行定义。
XML的用途:数据交换、跨平台应用开发、数据转换、数据库和配置文件。
<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
说明:声明该文档是一个XML文件,必须出现在文档的第一行。
version="1.0"表示该XML文档的版本为1.0。
"encoding"和"standalone"不显示,则默认处理。
encoding="ISO-8859-1"表示文档的编码为ISO-8859-1(西欧国家常用的字符编码),默认编码为UTF-8。
standalone="no"表示设置XML文档为非独立文档,默认为独立文档。
字符串"<?”和"xml"之间不可以留空格。
处理指令:用于应用程序处理XML文档。
以“<?”开始,以“?>”结束,不同的应用程序能识别不同的处理指令。当处理指令不能被应用程序识别时,将被忽略。
例:<?xml-stylesheet href="xsl/book.xsl" type="text/xsl" ?>
XML文档的注释:以“<!--”开头,以“-->”结束,中间为注释内容。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
说明:如果注释的信息较多,可以多行文档注释。注释内空可以包含任何特殊字符。
元素:是指标签及包含在标签内容的内容。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
<book>
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
</book>
元素的命名规则:
元素名只能以字母或下画线开头,其后可以跟数字、字母和下画线的任意组合;
元素名不能以XML(xml、Xml、xMl…)开头;
元素名不能包含空格;
元素的开始标签与结束标签名称必须完全一致(包含了大小写也必须完全一致)。
根元素:
每个XML文档都有且只有一个根元素。根元素是顶级元素(也是就第一个元素),除处理指令和注释外,其他所有元素都必须包含在根元素中。
注意:
1、XML是大小写敏感的,要特别注意;
2、文档类型声明、注释和文档处理指令都不是元素;
3、元素的开始标签和结束标签必须对称出现。如果某个元素的内容为空,则必须写为如下格式。
<author></author>
属性:指某件事物的特性,必须依附于元素存在,用于描述元素。
属性的习惯写法:属性名="属性值"
以下情况可以考虑使用属性:
无须扩展;
要存储的数据量不大;
数据与元素关系特别密切;
与元素的关系是一一对应的。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
<books>
<book id="001">
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
</book>
<book id="002">
<name>XML百例</name>
<price>68.00</price>
<author>张三</author>
</book>
</books>
实体引用:XML文档中有些特殊字符有着特殊意义。
XML内置了五种实体:
实体:lt 实体引用:< 含义:小于
实体:gt 实体引用:> 含义:大于
实体:amp 实体引用:& 含义:&
实体:apos 实体引用:' 含义:单引号
实体:quot 实体引用:" 含义:双引号
例:<?xml version="1.0" ?>
<book>
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
<em>价格88>50 是有点贵哦</em>
</book>
CDATA段:CADTA全称为字符数据(Character Data)
语法:<![CDATA[内容]]>
说明:内容中的全部字符都被处理器视为普通字符。
CDATA段不可嵌套,而且没有嵌套的必要;
“CDATA”字符串并不出现在真正的文本内容中;
当需要将大块文本内容填充到元素中时,比较适用CDATA部件。
例:<?xml version="1.0" ?>
<comment>
<![CDATA[在CDATA段中,“<”、“>”和“&”都当做是普通字符来处理]]>
</comment>
格式的良好性:
文档不能为空。如果文档中没有元素,该文档也就失去了存在的意义;
只能含有一个根元素;
元素之间的嵌套关系要正确;
属性必须依附于元素存在;
属性值必须用引号(单引号或双引号)括起来;
特殊字符必须使用实体引用。
有效性:
有效性一般是通过为XML定义Schema或 DTD来实现的,有效有性是进一步验证XML文档特性的一种手段。
Schema是用来定义XML文件,并利用该定义验证XML文件是否符合要求的一种技术。
XSLT(扩展样式表转换)则是提供将XML转达换为其他文件格式的一种转换规则。
XSLT的全称是Extensible Stylesheet Language Transformations。
Schema、XML和XSLT的关系:
有效的XML←Schema(验证)← XML文档 →XSLT(转换)→其他文件
XML的可扩展性体现在其标记可以由开发者自行定义。
XML的用途:数据交换、跨平台应用开发、数据转换、数据库和配置文件。
<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
说明:声明该文档是一个XML文件,必须出现在文档的第一行。
version="1.0"表示该XML文档的版本为1.0。
"encoding"和"standalone"不显示,则默认处理。
encoding="ISO-8859-1"表示文档的编码为ISO-8859-1(西欧国家常用的字符编码),默认编码为UTF-8。
standalone="no"表示设置XML文档为非独立文档,默认为独立文档。
字符串"<?”和"xml"之间不可以留空格。
处理指令:用于应用程序处理XML文档。
以“<?”开始,以“?>”结束,不同的应用程序能识别不同的处理指令。当处理指令不能被应用程序识别时,将被忽略。
例:<?xml-stylesheet href="xsl/book.xsl" type="text/xsl" ?>
XML文档的注释:以“<!--”开头,以“-->”结束,中间为注释内容。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
说明:如果注释的信息较多,可以多行文档注释。注释内空可以包含任何特殊字符。
元素:是指标签及包含在标签内容的内容。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
<book>
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
</book>
元素的命名规则:
元素名只能以字母或下画线开头,其后可以跟数字、字母和下画线的任意组合;
元素名不能以XML(xml、Xml、xMl…)开头;
元素名不能包含空格;
元素的开始标签与结束标签名称必须完全一致(包含了大小写也必须完全一致)。
根元素:
每个XML文档都有且只有一个根元素。根元素是顶级元素(也是就第一个元素),除处理指令和注释外,其他所有元素都必须包含在根元素中。
注意:
1、XML是大小写敏感的,要特别注意;
2、文档类型声明、注释和文档处理指令都不是元素;
3、元素的开始标签和结束标签必须对称出现。如果某个元素的内容为空,则必须写为如下格式。
<author></author>
属性:指某件事物的特性,必须依附于元素存在,用于描述元素。
属性的习惯写法:属性名="属性值"
以下情况可以考虑使用属性:
无须扩展;
要存储的数据量不大;
数据与元素关系特别密切;
与元素的关系是一一对应的。
例:<?xml version="1.0" ?>
<!--书的简单信息-->
<books>
<book id="001">
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
</book>
<book id="002">
<name>XML百例</name>
<price>68.00</price>
<author>张三</author>
</book>
</books>
实体引用:XML文档中有些特殊字符有着特殊意义。
XML内置了五种实体:
实体:lt 实体引用:< 含义:小于
实体:gt 实体引用:> 含义:大于
实体:amp 实体引用:& 含义:&
实体:apos 实体引用:' 含义:单引号
实体:quot 实体引用:" 含义:双引号
例:<?xml version="1.0" ?>
<book>
<name>XML学习天下</name>
<price>88.00</price>
<author>李四</author>
<em>价格88>50 是有点贵哦</em>
</book>
CDATA段:CADTA全称为字符数据(Character Data)
语法:<![CDATA[内容]]>
说明:内容中的全部字符都被处理器视为普通字符。
CDATA段不可嵌套,而且没有嵌套的必要;
“CDATA”字符串并不出现在真正的文本内容中;
当需要将大块文本内容填充到元素中时,比较适用CDATA部件。
例:<?xml version="1.0" ?>
<comment>
<![CDATA[在CDATA段中,“<”、“>”和“&”都当做是普通字符来处理]]>
</comment>
格式的良好性:
文档不能为空。如果文档中没有元素,该文档也就失去了存在的意义;
只能含有一个根元素;
元素之间的嵌套关系要正确;
属性必须依附于元素存在;
属性值必须用引号(单引号或双引号)括起来;
特殊字符必须使用实体引用。
有效性:
有效性一般是通过为XML定义Schema或 DTD来实现的,有效有性是进一步验证XML文档特性的一种手段。
Schema是用来定义XML文件,并利用该定义验证XML文件是否符合要求的一种技术。
XSLT(扩展样式表转换)则是提供将XML转达换为其他文件格式的一种转换规则。
XSLT的全称是Extensible Stylesheet Language Transformations。
Schema、XML和XSLT的关系:
有效的XML←Schema(验证)← XML文档 →XSLT(转换)→其他文件