XML
XML概述
XML,是一种可扩展的标记语言,标记语言:通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
可拓展:标签的名字是可以自定义的
可理解为:XML文件是由很多标签组成的,而标签名是可以自定义的
作用:
A系统--------------------->B系统
(XML文件)
A系统<---------------------A系统
XML标签
-
标签由一对尖括号和合法标识符组成
-
标签必须成对出现 (开始标签) (结束标签)
-
特殊的标签可以不成对,但是必须由结束标记
-
标签中可以定义属性,属性和标签名空格隔开
属性值必须用引号引起来
-
标签需要正确的嵌套
张三
XML语法规则
-
XML文件后缀名为:xml
-
文档声明必须是第一行第一列
<?xml version= "1.0" encoding="UTF-8" standalone= "yes" ?>version : 该属性是必须存在的
encoding : 该属性不是必须的
打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)
standalone : 该属性不是必须的,描述XML文件是否依赖其他的XML文件,取值为 yes/no
-
必须存在一个根标签,有且只能有一个
-
XML文件中可以定义注释信息
-
XML文件中可以存在以下特殊字符 [大于 小于 和号 单引号 引号]
-
XML文件中可以存在CDATA区
<![CDATA[...内容...]]>
解析XML
DOM解析思想
DOM文档对象模型:就是把文档的各个组成部分看做成对应的对象。
会把xml文件全部加载到内存。
[获取Document对象(整个xml文档对象)
-------->{Element对象(所有标签)------->Attribute对象(所有属性)-------->Text对象(所有文本内容)}(共同的父类Node对象)]
在内存中形成一个树形结构,再获取对应的值
<?xml version="1.0" encoding="utf-8" ?>
<!--注释的内容-->
<!--本XML文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生< ></info>
<message><![CDATA[内容<<<<<>>>>>]]></message>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
<aaa></aaa>
</students>
package XMLparse;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.ArrayList;
import java.util.List;
/**
* 利用dom4j解析xml文件
*/
public class xmlParse {
public static void main(String[] args) throws DocumentException {
//1.获取解析器对象
SAXReader saxReader = new SAXReader();
//2.利用解析器把xml文件加载到内存中,并返回一个文档对象
Document document = saxReader.read(new File("D:\\java学习04\\.idea\\xml\\student.xml"));
//3.获取到根标签
Element rootElement = document.getRootElement();
//4.通过根标签来获取student标签
//elements():可以获取调用者所有的子标签,会把子标签放到一个集合中返回
//elements("标签名"):可以获取调用者所有指定的子标签,会把这些子标签放到一个集合中并返回
//List list = rootElement.elements();
List<Element> studentElements = rootElement.elements("student");
//System.out.println(list.size());
//用来装学生对象
ArrayList<Student> list = new ArrayList<Student>();
//5.遍历集合,得到每一个student标签
for (Element element : studentElements) {
//element依次表示每一个student标签
//获取id这个属性
Attribute attribute = element.attribute("id");
//获取id这个属性值
String id = attribute.getValue();
//获取name标签
//element("标签名"): 获取调用者指定的子标签
Element nameElement = element.element("name");
//获取这个标签的标签体内容
String name = nameElement.getText();
//获取age标签
Element ageElement = element.element("age");
String age = ageElement.getText();
// System.out.println(id);
// System.out.println(name);
// System.out.println(age);
Student s = new Student(id,name,Integer.parseInt(age));
list.add(s);
}
for (Student student : list) {
System.out.println(student);
}
}
}
XML文档约束
约束:用来限定xml文件中可使用的标签以及属性(告诉程序员,xml该怎么写)
约束的分类:DTD schema
DTD约束
-
能在xml中引入约束文档
1.1 引入本地dtd
<!DOCTYPE 根元素名称 SYSTEM 'DTD文件的路径'>
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE persons SYSTEM 'persondtd.dtd'> <persons> <person> <name>张三</name> <age>23</age> </person> </persons>
1.2 再xml文件内部引入
<!DOCTYPE 根元素名称 [dtd文件内容]>
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE persons[ <!ELEMENT persons (person)> <!ELEMENT person (name,age)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> ]> <persons> <person> <name>张三</name> <age>23</age> </person> </persons>
1.3 引入网络dtd
<!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
-
能够简单阅读约束文档
-
根据约束编写xml文件
DTD语法规则
定义一个元素的格式为:<!ELEMENT 元素名 元素类型>
简单元素:
EMPTY:表示标签体为空
ANY:表示标签体可以为空也可以不为空
PCDATA:表示该元素的内容部分为字符串
复杂元素:
直接写子元素名称。
多个子元素可以使用"," 或者"|"隔开; "?"零次或一次
“,” 表示定义子元素的顺序; --------------------------> "+"一次或多次
“|” 表示子元素只能出现任意一个 "*"零次或多次 (如果不写则表示出现一次)
定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束>
属性的类型: CDATA类型:普通的字符串
属性的约束:
#REQUIRED :必须的
#IMPLIED :属性是不必须的
#FIXED value :属性值是固定的