XML
称为可扩展的标记语言,允许使用标记和子标记方式描述对象数据。
XML的声明
XML申明是XML文档的第一行,用于指定文档的版本和编码集,语法:
<?xml version="1.0" encoding="UTF-8" ?>XML的注释
XML注释用于说明某一个标签或内容的含义。编译时会忽略,语法:
XML的元素
XML元素是存储数据的单元,元素应该成对出现
如果元素中没有内容,应该以空标记描述
------
XML的根元素
根元素是一个完全包括文档中其它所有元素的元素。所有元素都必须在根元素中定义,一个XML文档有且只有一个根元素
XML标记的属性
XML标记的属性用于描述标记的特征。属性必须定义在标记中,必须以单引或双引包裹。同一个标记中,属性不能同名,属性和属性之间以空格隔开。
XML实体
在XML中预定义的符号如:<、‘’、>,如果XML文本中出现了这样的数据,可以使用预定义的实体来代替
&It;-------- <
>;-------- >
&;----- &
";------ ”
&apos;------- ’
CDATA标记
由于XML实体阅读起来很不直观,我们可以用CDATA标记代替。CDATA标记中的内容,XML解释器都当文本处理,标记不会被展开。
语法:
<![CDATA[
价格 <、>、‘、“丰田
]]>
XML语法规则
格式良好的XML文档:
满足XML语法规则的XML文档,称为格式良好的XML。格式良好的XML,才能正确被XML解析器和应用程序解析。
1、必须要有XML文档声明
2、有且只有一个根元素
3、标记区分大小写
4、标记要成对出现
5、属性要加引号
6、空标记要关闭
7、元素要正确嵌套
XML文档的校验技术
格式良好的XML,满足XML的语法规则,但是XML文档中的标记、属性、以及标记的嵌套关系无法描述。
DTD和Schema都是用于定义XML结构,并且用于校验我们书写的XML文档是否符合要求的技术
<?xml version="1.0" encoding="GB2312" ?>
<!DOCTYPE 家庭 [ DOCTYPE 表示定义根元素为”家庭“
<!ELEMENT 家庭 (人+,家电*)> ELEMENT 用于定义元素。家庭(人+,家电*)表示家庭元素中有两个子元素:人和家电。其中人子元素出现一次或多次,而家电元素出现零次或多次。
<!ELEMENT 人 (#PCDATA)> #PCDATA表示在人元素中的内容,为文本
<!ELEMENT 家电 EMPTY> EMPTY 表示家电元素为空标记
<!ATTLIST 人 ATTLIST表示给指定元素定义属性
名字 CDATA #REQUIRED CDATA表示该属性内容为文本。#REQUIRED表示该属性必须书写
性别 (男|女) #REQUIRED 性别属性只能是男或女
爱好 CDATA #IMPLIED #IMPLIED表示该属性可有可无
>
<!ATTLIST 家电
名称 CDATA #REQUIRED
说明 CDATA #IMPLIED
>
]>
有效的XML文档:有效的XML文档。除了要满足XML语法规则以外,还必须满足对应DTD或Schema描述元素规则。
有效的XML文档,一定是格式良好的XML文档。但格式良好的XML文档,不一定有效
XML的解析技术
XML文档内容,需要读取到内存中,才能被应用程序所识别。对于标记、子标记,以及标记属性数据的提取,称为XML解析。
XML解析技术有两种:DOM解析和SAX解析
DOM解析特点:
1、基于树状结构的API
2、将整个XML文档内容,读取到内存,进行解析和存储
3、可以随机访问XML文档的内容
4、大型文档可能造成内存紧张
SAX解析特点:
1、不必将整个文件加载到内存中,占用的内存少
2、不能随机访问XML文档内容
3、文档只能遍历一次
4、SAX只能读取,不能写入
DOM解析和SAX解析各有优缺点,在开发种,通常使用第三方进行XML的解析。从而简化解析的过程。常用的有:JDOM和DOM4J
解析流程:
public List<Student> getList() {
List studentList = new ArrayList<>();
SAXReader sax = new SAXReader();
try {
//读取XML文档,将读取信息存放到document对象中
Document doc = sax.read("src/main/java/com/lovo/xml/txt/lovoClass.xml");
//选择一个节点,一个student标记就是一个Node对象
List<Element> elementList = doc.selectNodes("/lovoClass/student");
for (Element em : elementList) {
Student s = new Student();
//将student标签中的code属性取出,封装为学生对象的code属性
s.setCode(Integer.valueOf(em.attributeValue("code")));
s.setPhone(em.attributeValue("tel"));
//将student标签的子元素name中间的文本取出,封装为学生对象的name属性
s.setName(em.elementText("name"));
s.setEdu(em.elementText("edu"));
s.setAge(Integer.valueOf(em.elementText("age")));
// System.out.println(s);
studentList.add(s);
}
} catch (Exception e) {
e.printStackTrace();
}
return studentList;