XML
XML 是一种可扩展的标记语言,通过标签来描述数据的一门语言(标签我们也可以称之为元素)
主要作用: XML 文件是由很多标签组成的,而标签名是可以自定义的,可以用于进行存储数据和传输数据以及软件的配置文件
XML标签
- 标签由一对尖括号和合法标志符组成
- 标签必须成对出现
- 特殊的标签可以不成对,但是必须有结束标记
- 标签中可以定义属性,属性和标签名空格隔开,属性值用引号括起来
- 标签可以嵌套使用
语法规则
-
XML 文件的后缀名为.xml
-
文档声明必须是第一行第一列
<?xml version="1.0" encoding="utf-8" standalone="no"?>version 该属性是必须存在的
encoding 该属性不是必须的
standalone 该属性不是必须的,表述XML 文件是否依赖于其他的xml文件
-
必须存在一个根标签,有且只有一个
-
XML 文件中可以定义注释信息
-
XML 文件中可以存在特殊字符
-
XML 文件中可以存在CDATA 区 <![CDATA[...内容...]]>
解析XML
常见的解析思想 :DOM 文档对象模型: 就是把文档的各个组成部分看做成对应的对象。会把xml文件全部加载到内存,形成一个树形结构,再获取对应的值
通过根标签 Document 获取到子标签 ,然后再根据子标签一层一层的解析
Document 对象 整个文档对象
Element对象 元素也叫标签 ,通过根标签来查找每个子标签
Attribute 对象:所有属性
Text对象:所有文本内容
常见的解析工具DOM4J
//1.获取解析器对象
SAXReader saxReader = new SAXReader();
//2.利用解析器把xml文件加载到内存中,并返回一个文档对象
Document document = saxReader.read(new File("xml/student.xml"));
//3.获取到根标签
Element rootElement = document.getRootElement();
// 4.通过根标签来获取所有的子元素
// elements() 可以获取调用者所有的子标签
// elements("标签名") 可以获取指定的标签名
List<Element> elements = rootElement.elements();
System.out.println(elements.size());
for (Element element : elements) {
// 获取属性
Attribute attribute = element.attribute("id");
// 获取属性值
String id = attribute.getValue();
//获取标签
Element nameElement = element.element("name");
//获取标签体内容
String name = nameElement.getText();
// 获取age标签
Element ageElement = element.element("age");
String age = ageElement.getText();
}
也可以利用Xpath 表达式解析xml
<!--dom4j依赖-->
<dependency>
<groupId>dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>1.6.1</version>
</dependency>
<!--xpath表达式依赖-->
<dependency>
<groupId>jaxen</groupId>
<artifactId>jaxen</artifactId>
<version>1.1.6</version>
</dependency>
Document document = reader.read(resourceAsStream);
Element rootElement = document.getRootElement();
List<Element> beanList = rootElement.selectNodes("//bean");