1.文档声明
用来声明xml的基本属性,用来指挥解析引擎怎样去解析当前xml
通常一个xml都要包括而且仅仅能包括一个文档声明
xml的文档必须在整个xml的最前面,在文档声明之前不能有不论什么内容
<?xml version="1.0" ?>--version是必须存在的属性,表明当前xml所遵循规范的版本号,眼下位置都写1.0就能够了
<?xml version="1.0" encoding="utf-8" ?>--encoding用来仅仅会解析引擎在解析xml时使用的编码,一定要保证xml格式的数据在保存时使用的编码和解析时使用的编码必须一致,才不会有乱码问题
<?xml version="1.0" encoding="utf-8" standalone="yes" />--standalone属性用来指明当前xml是否是一个独立的xml,默认值是yes表明当前文档不须要依赖于其它文档,假设当前文档依赖其它文档而存在则须要将此值设置为no
2.元素
一个xml标签就是一个元素
一个标签分为開始标签和结束标签
在開始标签和结束标签之间能够包括文本内容,这种文本内容叫做标签体
假设标签的開始标签和结束标签之间不包括标签和子标签则能够将開始标签和结束标签进行合并,这种标签就叫做自闭标签
一个标签中也能够包括随意多个子标签,可是一定要注意标签一定要合理嵌套
一个格式良好的xml要包括而且仅仅能包括一个根标签,其它的标签都应该是这个标签的子孙标签
区分大写和小写,比如。<P>和<p>是两个不同的标记。
不能以数字或标点符号或"_"开头。
不能以xml(或XML、或Xml 等)开头。
不能包括空格
名称中间不能包括冒号(:)。
3.属性
一个标签能够有多个属性,每一个属性都有它自己的名称和取值,比如:
<china capital="beijing"/>
属性的名在定义时要遵循和xml元素同样的命名规则
属性的值须要用单引號或双引號括起来
4. 凝视
<!-- 凝视内容 -->
凝视能够出如今xml文档的任何位置除了整个文档的最前面.不能出如今文档声明之前
凝视不能嵌套凝视
5.CDATA区/转义字符
<![CDATA[转义的内容]]>:
当XML中一段内容不希望被解析器解析时能够使用CDATA区将其包住
当解析器遇到CDATA区时会将其内容当作文本对待。不会进行解析
语法:<![CDATA[ 内容 ]]>
转义字符:
& --> &
< --> <
> --> >
" --> "
' --> '
6.处理指令
处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎怎样解析XML文档内容。
<?
xml-stylesheet type="text/css" href="1.css"?
>
二、dtd语法 --- 了解语法,看得懂dtd就能够
1.怎样在xml中引入dtd
(1)外部引入
能够将dtd的约束内容写在外置的dtd文件里,这个文件后缀必须为.dtd而文件保存时必须用utf-8编码保存.
再在xml文件里使用
<!DOCTYPE 根元素名称 SYSTEM 文件的位置>
假设写的是SYSTEM表明当前引入的dtd在当前文件系统中,后面制定的文件位置是当前硬盘中的位置
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
假设写的是PUBLIC表明当前引入的dtd在网络公共位置中,后面要指明dtd的名字和dtd所在网络位置URL地址
(2)内部引入
直接在xml中书写dtd
<!DOCTYPE 根元素名称[
dtd约束....
]>
2.dtd语法
(1)元素
<!ELEMENT 元素名称 元素约束>
元素约束:
存放类型:ANY/EMPTY
元素约束:子元素的列表,将能够包括的子元素用小括号括起来
子元素之间能够使用逗号进行切割,表明子元素必须依照顺序出现
子元素之间能够使用竖线进行切割,表面子元素出现当中之中的一个
#PCDATA 表明包括标签体
+ 表示一次或多次
* 0次或多次
?
0次或一次
也能够使用小括号进行组的操作
(2)属性
<!ATTLIST 元素名
属性名 属性类型 属性约束
属性名2 属性类型 属性约束
......
>
属性类型:
CDATA:表示属性的值是一个普通字符串
ENUMERATED : 属性的值是一个枚举列表中的值
ID: 表明属性的值必须在整个文档中都是唯一的,假设有反复的id则校验不通过,ID 属性的值仅仅能由字母。下划线開始,不能使用数字。不能出现空白字符
属性约束:
#REQUIRED --- 表明当前属性是一个必须存在的属性,假设这种属性不存在则在校验时会报错
#IMPLIED --- 表明当前属性是一个可选的属性,能够有也能够没有
#FIXED '固定值' --- 表明当前属性具有一个固定值,这种属性不须要进行赋值,自己主动就会取这个固定值为值.假设这种属性指定了一个不是固定值的值则校验报错
'默认值' --- 表明当前属性具有一个默认值,假设给了其它的值就用其它值,假设没有给值则取这个默认值
(3)ENTITY(实体)
<!ENTITY >,就是对一大段内容的引用,能够简化代码的复用
引用实体:在xml中引用的实体叫做引用实体
<!ENTITY 实体名称 “实体内容” >
&实体名称;
參数实体:在dtd中引用的实体叫做參数实体
<!ENTITY % 实体名称 "实体内容">
%实体名称;
三、XML编程:利用java程序去增删改查(CRUD)xml中的数据
解析思想:
dom解析
sax解析
基于这两种解析思想市面上就有了非常多的解析api
sun jaxp既有dom方式也有sax方式,而且这套解析api已经增加到j2se的规范中,意味这不须要导入不论什么第三方开发包就能够直接使用这样的解析方式.可是这样的解析方式效率低下,没什么人用.
dom4j 能够使用dom方式高效的解析xml.
pull
!!dom4j
导入开发包,通常仅仅须要导入核心包就能够了,假设在使用的过程中提示少什么包到lib文件夹下在导入缺少的包就可以
四、Schema -- xml的约束技术 --- 须要掌握名称空间的概念,会读简单的Schema就能够了,不须要大家自己会写
Schema是xml的约束技术,出现的目的是为了替代dtd
本身也是一个xml,很方便使用xml的解析引擎进行解析
对名称空间有很好的支持
支持很多其它的数据类型,而且支持用户自己定义数据类型
能够进行语义级别的限定,限定能力大大强于dtd
相对于dtd不支持实体
相对于dtd复杂的多,学习成本比較的高
怎样在xml中引入Schema --- !!!!!名称空间的概念:全世界独一无二的名字,用来唯一的标识某个资源,一般是公司的域名,仅仅是名字而已并不真的表示资源的位置.
~~~ Schema的语法---參照Schema的文档,了解就可以