一,XML简介
XML(EXtensible Markup Language):可扩展标记语言
XML 是一种很像HTML的标记语言。
XML 的设计宗旨是传输数据,而不是显示数据。
XML 标签没有被预定义。您需要自行定义标签。
XML 是 W3C 的推荐标准。
1.XML 和 HTML 之间的差异
XML 和 HTML 为不同的目的而设计:
(1)XML 被设计用来传输和存储数据,其焦点是数据的内容。
(2)HTML 被设计用来显示数据,其焦点是数据的外观。
2.XML的特点
XML与操作系统、编程语言的开发平台无关。
规范统一。
3.XML的优势
存储数据;数据交换;数据配置
4.XML文档结构
5. XML声明
(1)XML声明:用以表明该文件是一个XML文档
<?xml version="1.0" encoding="UTF-8"?>
version:文档符合XML1.0规范。
encoding:文档字符编号,默认为”UTF-8”
对于任何一个XML文档,其声明部分都是固定的格式
(2)XML标签
<标签名>标签描述的内容</标签名>
用<>括起来的各种标签来标记数据
任何一个XML文件可以包含任意数量的标签
6.XML元素
<元素名 属性名=“属性值”>元素内容</元素名>
XML元素:元素由开始标签、元素内容和标签组成。元素内容可以包含子元素、字符数据等
7.XML根元素
(1)每个XML文档有且只有一个根元素
(2)根元素的特点如下:
根元素是一个完全包括文档中其他所有元素的元素。
根元素的开始标签要放在所有其他元素的开始标签之前。
根元素的结束标签要放在所有其他元素的结束标签之后。
8.XML属性
一个元素可以有多个属性,多个属性之间用空格隔开。
属性只能放在开始标签中。
属性值用双引号包裹,属性值中不能直接包含<、“、&。
<元素名 属性名=“属性值” 属性名=“属性值” >元素内容</元素名>
9.XML中的特殊字符的处理
二,格式良好的XML文档
必须有XML声明语句。
必须有且只有一个根元素。
XML标签对大小写敏感。
XML标签成对出现。
XML元素正确的嵌套。
元素名称可以包含字母、数字或其他的字符。
元素名称不能以数字或者标点符号开始。
元素名称中不能含空格。
1.XML中的命名空间
场景:XML解析器在解析XML文档时,对于重名的元素,可能出现解析冲突。
命名空间的作用:命名空间有助于标准化元素和属性,并为它们加上唯一的标识,提供避免元素命名冲突的方法。
xmlns:[prefix]=“[命名空间的URI]”
2.四种常见的XML解析技术
(1) DOM解析XML
DOM是Document Object Model即文档对象模型的简称。
DOM把XML文档映射成一个倒挂的树。
(2)org.w3c.dom包中的常用接口
Document接口:Document对象代表整个XML文档,它也是对XML文档进行操作的起点。
Document接口继承自Node接口:
Node接口:表示树中的一个抽象节点。
NodeList接口:包含了一个或者多个节点的列表。
Element接口:代表XML文档中的标签元素。
Element接口继承自Node,也是Node最主要的子对象。在标签中可以包含属性。
三,DOM读取XML的步骤
1.创建解析器工厂对象(DocumentBuilderFactory)。
2.由解析器工厂对象创建解析器对象(DocumentBuilder)。
3.由解析器对象对指定XML文件进行解析,构建相应DOM树,创建Document对象。
4.以Document对象为起点对DOM树的节点进行增删改查操作使用
四,使用DOM保存XML文档
1.创建转换器工厂对象(TransformerFactory)。
2.由转换器工厂对象创建转换器对象(Transformer)。
3.创建DOMSource对象(DOMSource)。
4.由转换器对象设置输出格式(setOutputProperty方法)。
5.创建StreamResult对象(包含保存文件的信息)。
6.将XML保存到指定文件中(transform方法)。