xml概述
可扩展标记语言(Extensible Markup Language),标准通用标记语言的子集,简称XML。是一种用于标记电子文件使其具有结构性的标记语言。
xml应用
- 配置文件
- 存放数据
xml语法
文档声明
- 必须以<?xml 开头,以?>结束
- 必须从文档的0行0位置开始
- 文档声明只有三个属性
- version:文档版本,必选属性,一般选择1.0
- encoding:文档编码格式,可选属性,默认是utf-8
- standalone:是否是独立文档,可选属性,默认是yes。如果是no,表示依赖外部的约束条件
元素 element
- 普通元素由开始标签、元素体、结束标签组成
- 元素体:可以是元素,也可以是文本
- 空元素
- 元素命名
- 区分大小写
- 不能使用空格,冒号
- 不建议使用和xml相关的文本开头,Xml、XML。。。
- 良好的xml文档,必须有一个根元素
属性
- 属性必须在开始标签中
- 属性值必须使用单引号或者双引号
- 属性名不能使用空格、冒号等特殊字符,必须以字母开头
注释
\<!-- 注释文本 -->
转义字符
CDATA 区
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。
当大量转义字符出现在xml文档中时,会使其可读性降低。
CDATA 部分由 “<![CDATA[" 开始,由 "]]>” 结束。
xml约束
常见的xml约束:DTD、Schema
DTD
文档类型定义(DTD,Document Type Definition)是一种特殊文档,它规定、约束符合标准通用标示语言(SGML)或SGML子集可扩展标示语言(XML)规则的定义和陈述。
Schema
- 比DTD强大
- 扩展名是xsd,而不是xml
- 支持名称空间
xml解析
解析方式
开发中常用的解析方式有三种:
- DOM:要求解析器将xml文档装载到内存,解析成一个document对象
- SAX:逐行扫描文档,一边扫描,一边解析
- PULL:Android内置的xml解析方式,类似SAX
解析器
就是根据不同的解析方式提供的具体实现。常用的解析器如下:
- dom4j
- jaxp
- jdom
- jsoup