一、xml
1 - xml概述
- xml概述:XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言
- 标记语言:通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
- 可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的
- 作用:用于进行存储数据和传输数据;作为软件的配置文件
- 作为配置文件的优势:可读性好;可维护性高
- 标签规则
- 标签由一对尖括号和合法标识符组成:
<student>
- 标签必须成对出现:
<student> </student>
前边的是开始标签,后边的是结束标签 - 特殊的标签可以不成对,但是必须有结束标记:
<address/>
- 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来:
<student id="1"> </student>
- 标签需要正确的嵌套:
- 这是正确的:
<student id="1"> <name>张三</name> </student>
- 这是错误的:
<student id="1"><name>张三</student></name>
- 语法规则
- XML文件的后缀名为:xml
- 文档声明必须是第一行第一列:
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
- version:该属性是必须存在的,值固定1.0
- encoding:该属性不是必须的;打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)
- standalone:该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no
- 必须存在一个根标签,有且只能有一个
- XML文件中可以定义注释信息
- XML文件中可以存在以下特殊字符
<
:< 小于>
:> 大于&
:& 和号'
:’ 单引号"
:" 引号
- XML文件中可以存在CDATA区:里面的内容就是纯文本显示
<?xml version="1.0" encoding="UTF-8" ?>
<students>
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生< >>>>>>>>>>>的信息</info>
<message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
</student>
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>
2 - xml使用dom4j解析
- xml解析的概述:xml解析就是从xml中获取到数据
- DOM解析思想:DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象;会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值
![在这里插入图片描述](https://img-blog.csdnimg.cn/e01afe7ea26e4d1face8d95a22f6843b.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5peg5LyR5q2i56ym,size_20,color_FFFFFF,t_70,g_se,x_16)
- xml解析的准备工作
- ①.dom4j下载:https://dom4j.github.io/
- ②.将下载好的dom4j-1.6.1.zip解压,得到dom4j-1.6.1.jar文件
- ③.在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中
- ④.选中jar包 -> 右键 -> 选择add as library即可
//student.xml
<?xml version="1.0" encoding="UTF-8" ?>
<students>
<student id="1">
<name>张三</name>
<age>23</age>
</student>
<student id="2">
<name>李四</name>
<age>24</age>
</student>
<aaa></aaa>
</students>
public class Student {
private String id;
private String name;
private int age;
public Student() {
}
public Student(String id, String name, int age) {
this.id = id;
this.name = name;
this.age = age;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"id='" + id + '\'' +
", name='" + name + '\'' +
", age=" + age +
'}';
}
}
public class XmlParse {
public static void main(String[] args) throws DocumentException {
SAXReader saxReader = new SAXReader();
Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
Element rootElement = document.getRootElement();
List<Element> studentElements = rootElement.elements("student");
ArrayList<Student> list = new ArrayList<>();
for (Element element : studentElements) {
Attribute attribute = element.attribute("id");
String id = attribute.getValue();
Element nameElement = element.element("name");
String name = nameElement.getText();
Element ageElement = element.element("age");
String age = ageElement.getText();
Student s = new Student(id,name,Integer.parseInt(age));
list.add(s);
}
for (Student student : list) {
System.out.println(student);
}
}
}
二、DTD约束
- 什么是约束:用来限定xml文件中可使用的标签以及属性
- 约束的分类:DTD、schema
- DTD元素的分类
- 复杂元素:有子元素的元素
<!ELEMENT persons (person)>
、<!ELEMENT person (name,age)>
- 简单元素:没有子元素
<!ELEMENT name (#PCDATA)>
、<!ELEMENT age (#PCDATA)>
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
- 引入DTD约束
- 引入本地dtd:
<!DOCTYPE 根元素名称 SYSTEM ‘DTD文件的路径'>
- 在xml文件内部引入:
<!DOCTYPE 根元素名称 [ dtd文件内容 ]>
- 引入网络dtd:
<!DOCTYPE 根元素的名称 PUBLIC "DTD文件名称" "DTD文档的URL">
- 引入本地DTD约束
// 这是persondtd.dtd文件中的内容,已经提前写好
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
// 在person1.xml文件中引入persondtd.dtd约束
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons [
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>
- DTD定义元素格式:
<!ELEMENT 元素名 元素类型>
- DTD定义简单元素
- EMPTY:表示标签体为空
- ANY:表示标签体可以为空也可以不为空
- PCDATA:表示该元素的内容部分为字符串
- DTD定义复杂元素
- 直接写子元素名称. 多个子元素可以使用",“或者”|"隔开;
- ","表示定义子元素的顺序 ; “|”: 表示子元素只能出现任意一个
- "?"零次或一次, "+"一次或多次, "*"零次或多次;如果不写则表示出现一次
- DTD定义属性的格式:
<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束>
- 属性的类型:CDATA类型:普通的字符串
- 属性的约束:
- #REQUIRED: 必须的
- #IMPLIED: 属性不是必需的
- #FIXED value:属性值是固定的
<!ELEMENT persons (person+)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ATTLIST person id CDATA #REQUIRED>
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
<person id="001">
<name>张三</name>
<age>23</age>
</person>
<person id = "002">
<name>张三</name>
<age>23</age>
</person>
</persons>
三、schema约束
- schema和dtd的区别
- ①.schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
- ②.一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
- ③.dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
- ④.schema 语法更加的复杂
![在这里插入图片描述](https://img-blog.csdnimg.cn/106e3fa602b241588f81f4b150d4f02d.png)
- schema约束简单实现
- complexType:表示是复杂元素
- sequence:表示要按顺序来标签
![在这里插入图片描述](https://img-blog.csdnimg.cn/243a9a6622fe4d0da3e7680ca6f5714b.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5peg5LyR5q2i56ym,size_20,color_FFFFFF,t_70,g_se,x_16)
<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.itheima.cn/javase"
elementFormDefault="qualified"
>
<element name="persons">
<complexType>
<sequence>
<element name = "person">
<complexType>
<sequence>
<element name = "name" type = "string"></element>
<element name = "age" type = "string"></element>
</sequence>
<attribute name="id" type="string" use="required"></attribute>
</complexType>
</element>
</sequence>
</complexType>
</element>
</schema>
- 引入schema约束步骤
- ①.在根标签上定义属性xmlns=“http://www.w3.org/2001/XMLSchema-instance”
- ②.通过xmlns引入约束文件的名称空间
- ③.给某一个xmlns属性添加一个标识,用于区分不同的名称空间;格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi
- ④.通过xsi:schemaLocation指定名称空间所对应的约束文件路径;格式为:xsi:schemaLocation = "名称空间url 文件路径“
<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.itheima.cn/javase"
xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
<person id="001">
<name>张三</name>
<age>23</age>
</person>
</persons>
<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.itheima.cn/javase"
elementFormDefault="qualified"
>
<element name="persons">
<complexType>
<sequence>
<element name = "person">
<complexType>
<sequence>
<element name = "name" type = "string"></element>
<element name = "age" type = "string"></element>
</sequence>
<attribute name="id" type="string" use="required"></attribute>
</complexType>
</element>
</sequence>
</complexType>
</element>
</schema>
<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.itheima.cn/javase"
xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
<person id="001">
<name>张三</name>
<age>23</age>
</person>
</persons>