一 认识XML
XML是Extensible Markup Language及可扩展标记语言的缩写,是一种简单的数据存储语言,使用一系列简单的标记来描述数据.
1.XML声明
<?xml version="1.0" encoding="UTF-8"?>表示XML声明,用于标明该文件是一个XML文档.
2.XML声明由以下几个部分组成
version:文档符合XML1.0规范.
encoding:文档字节编码,默认为"UTF-8".
3.标签
在XML中,用尖括号 括起来的各种标签(Tag)来标记数据,标签需成对使用来界定字符数据,例如,<author>王姗</author这一对标签中,<author>是开始标签,</author>是结束标签,“王姗”是标签描述的内容,表示作者信息。XML文件可以包含任意数量的标签。
4. 根元素
每个XML文档必须有且仅有一个根元素,如<books></books>。根元素的特点如下。
根元素是一个完全包括文档中其他所有元素的元素。根元素的起始标签要放在所有其他元素的起始标签之前。根元素的结束标签要放在所有其他元素的结束标签之后。
5.元素
XML文档的主要部分是元素,元素由开始标签、元素内容和结束标签组成。元素内容可以包含子元素、字符数据等。如<author>王姗</author>就是一个元素。
6.元素的命名规则如下
名称中可以包含字母、数字或者其他字符。
名称不能以数字或者标点符号开始。
名称不能以字符xml(或者XML、Xml)开始。
名称中不能包含空格。
XML编程
</title>
</name>
②元素允许是空元素,如以下元素的写法是允许的。<title> </title>
<title></title>
<title/>
7. XML中的特殊字符的处理
在XML中,有时在元素的文本中会出现一些特殊字符(如<、>、‘、”、&),而XML文档结构本身就用到了这几个特殊字符,有以下两种办法,可以正确地解析包含特殊字符的内容。
(1)对这5个特殊字符进行转义,也就是使用XML中的预定义实体代替这些字符,XML中的预定义实体和特殊字符的对应关系如图所示。
实体名称 | 字符 |
< | < |
> | > |
& | & |
" | " |
' | ' |
7. XML中的注释
注释的语法格式如下。
<-注释内容-->
8. 格式良好的 XML 文档
格式良好的XML文档需要遵循如下规则。
必须有XML声明语句。
>必须有且仅有一个根元素。
>标签大小写敏感。
>属性值用双引号包含起来。
>标签成对出现。
元素正确嵌套。
9 XML优势
XML独立于计算机平台、操作系统和编程语言来表示数据,凭借其简单性、可扩展性、交互性和灵活性在计算机行业中得到了世界范围的支持和采纳。XML基于文本格式,允许开发人员描述结构化数据并在各种应用之间发送和交换这些数据,使得不同系统之间交互数据具备了统一的格式。
XML的优势主要体现在以下几点。
数据存储:XML与Oracle和SQL Server等数据库一样,都可以实现数据的持久化存储。XML极其简单,正是这点使得XML与众不同。
>数据交换:在实际应用中,由于各个计算机所使用的操作系统、数据库不同,因此数据之间的交换很复杂。现在可以使用XML来交换数据,例如可以将数据库A中的数据转换成标准的XML文件,然后数据库B再将该标准的XML文件转换成适合自己数据要求的数据,以达到交换数据的目的。再比如,气象部门发布了天气预报信息,不同的系统(计算机、手机)以及不同的软件(QQ、MSN)和各种网站都可以去读取和显示这些信息,正是因为天气预报信息以XML格式存储,才使得不同系统、不同软件都能解析统一格式的数据并显示。数据配置:许多应用都将配置数据存储在XML文件中。
10. Schema 常用元素类型
Schema常用元素类型如下所示。
根元素:schema。
定义元素和属性的元素:element、group、attribute和 attributeGroup.
定义简单类型的元素:simpleType。
定义复杂类型的元素:complexType
进行类型约束的元素:choice、unique、sequence和restriction。