一.XML的背景.发展历史
Markup Language: 标记语言,或标志语言
HTML: Hyper Text Markup Language超文本标记语言
标记不可扩展,只有一组固定的标记集合
XML: eXtensible Markup Language可扩展的标记语言,记可扩展,可以自定义标记.
二.XML文件的语法规则
1.声明
<?xml version="1.0" encoding="gb2312" ?>
可能包含其他声明,写在第一行之后.
2.标记
开始标记: <标记名称>
结束标记: </标记名称>
<书名>笑傲江湖</书名>
空标记:开始标记和结束标记之间没有内容时.
比如: <价格></价格>,可以简写为: <价格 />
3.元素.
开始标记,结束标记以及中间的内容称为元素.
元素可以嵌套元素.例如:
<a>data</a>
<b><a>data</a></b>
最外层的元素叫根元素.
1)元素中的标记必须成对出现,也就是说:有开始有结束.
2)元素必须被正确嵌套.
3)元素标记大小写敏感
4)标记的命名规则:不能以数字开头.不能占用关键字(xml).
5)必须有唯一的根元素.
4.实体引用
< : less than : <
> : great than : >
" : "
' : '
5.属性
定义在开始标记中的一组键值对.一个标记可以有任意多的属性.属性必须有值,属性值必须用引号引起来.
6.CDATA
<![CDATA[一段表示其本意的文字,当作一个整体来处理:<
<book>我的书</book>
<<书名>>]]>
7.注释
<!-- 这是一段注释 -->
遵循所有xml语法规则的xml文件,被称作形式良好的文件(well-formed).
不遵循规则的xml文件,是非法的(invalid),是没有价值的文件.
invalid < well-formed < valid
如果一个形式良好的xml文件有DTD规则并遵循此规则,叫做有效(valid)的.
有效的xml文件才是最有价值的.
三.DTD: Document Type Difinition(文档类型定义)
规范xml文件的文件结构为xml文件提供规则.
语法形式:
<!DOCTYPE 根元素 [
定义xml标记的规则
]>
* : 0到多个
+ : 1到多个
? : 0或1个.
(a|b) : a和b任选其一
浏览器不能检测是否遵从DTD.
其他工具: MyEclipse / XML SPY
属性: attribute
四.Xml文件的解析(读和写)
两种类型的解析方式:
1.DOM: Document Object Model 文档对象模型
树形结构装载到内存中.完成后才开始解析.
如果文件比较大,内存压力,时间延迟.
可以对树形结构做任何操作:加节点,删节点,遍历...
2.SAX: Simple API for XML
流(Stream)的特征,解析可以立即开始.
不保存数据. 对内存无压力.不能修改节点.
适合大文件的解析.
DOM4J / JDOM
读book.xml:
1)获取到Document对象
2)获取到RootElement
3)获取根元素的子元素集合
4)遍历子元素集合,每个元素再取子元素集合
5)重复第4步.直到叶子元素.
写students.xml:
1)构建Document对象
2)addElement增加根元素
3)逐层增加子元素: addElement
4)元素的setText设置元素内容
5)元素的setAttribute设置元素属性
6)输出
buildXml:
Element el = elmt.addElement("子标记名称");
el.setText("元素内容");
elmt.addAttribute("属性名","属性值");