在上一篇博客:XML基础 中说到,XML可以用作一个小型的数据库,那么这个“数据库”到底该怎么用呢???
这就需要用到XML解析。这篇博客中,主要通过以下一个案例,来分析XML的DOM解析:
一、案例:xml实现的一个简单通讯录
编写一个XML文件(contact.xml),内容如下:
这时候,要想实现一个通讯录系统,首先要将xml文件中的内容提取出来,然后封装成一个联系人对象。
二、什么是DOM解析:
DOM解析就是将XML文件全部载入到内存,组装成一颗DOM树,然后通过节点以及节点之间的关系来解析XML文件,然后获取/修改 该DOM文件中的标签、属性、文本等信息。
DOM树:DOM树就是在解析XML文件时,每一个XML文件中都有一个根节点,其他节点都是根节点的后代节点,就拿上面的那个例子来说:
DOM解析是一种基于面向对象的解析方式;
DOM解析的缺点:
- 如果XML中文件节点噌地太深,不适合使用DOM解析
三、XML的DOM解析的前提准备
首先,我这里使用的工具是IDEA+maven。
要想使用DOM解析XML文件,还需要对应的工具,常见的有一下两种:
- 官方提供的工具:jaxp
- 第三方工具:dom4j (意思是dom for java)我这里使用的是dom4j
导入dom4j,直接在maven的pom文件中添加依赖:
<!--dom4j提供的jar包-->
<dependency>
<groupId>dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>1.6.1</version>
</dependency>
四、DOM解析的步骤:
- 写好对应的XML文件(如上:contact.xml)
- 创建xml解析器对象
- 利用解析器对象的read(url) // 其中的url是资源目录地址
- 要么使用绝对路径
- 要么使用maven工具下面的资源文件,获取当前类的字节码文件对象
- 返回一个document对象,解析xml文件形成的DOM树的节点
五、DOM解析的实例:
1、读取contact.xml 文件
public class Test1
{
public static void main(String[] args) throws DocumentException {
// 1、写好对应的xml文件
// 2、创建xml解析器对象
SAXReader reader = new SAXReader();
// 3、用read方法读取xml文件 (使用绝对路径的方式)
Document document = reader.read("D:\\WorkPlace\\Java\\JavaWeb_XML" +
"\\src\\main\\resources\\contact.xml");
System.out.println(document);
}
}
/**
* 运行结果:
*org.dom4j.tree.DefaultDocument@7ef20235[Document:nameD:\WorkPlace\Java\JavaWeb_XML\src\main\resources\contact.xml]
*/
2、获取标签:
- 获取根节点对象:getRootElement ();
- 获取标签的名称:节点对象.getName();
- 获取子标签对象:element("标签名称"); 默认获取第一个子标签的对象
- 获取子标签对象:elements("标签名称") 默认获取所有同名子标签对象 返回值为List<Element>集合
- 获取当前节点下所有子节点对象:elements(); 返回一个List<Element>集合
使用案例:
(1)获取根节点对象:
public class Test {
public static void main(String[] args) throws DocumentException {
// 获取跟节点对象:
// 创建xml解析器对象
SAXReader reader = new SAXReader();
// 调用read(url)方法,其中的url为maven项目下的资源文件,获取当前类的字节码文件对象
Document document = reader.read(Test.class.getClassLoader().getResource("contact.xml"));
Element root = document.getRootElement();
System.out.println(root); // 输出根节点对象
System.out.println(root.getName()); // 输出跟节点对象的名称
}
}
/**
* 运行结果:
* org.dom4j.tree.DefaultElement@7ef20235 [Element: <concat-list attributes: []/>]
* concat-list
*/
(2)获取concat对象:(根节点的子节点)
(3)获取第一个concat下的所有子节点对象
3、获取属性
- 获取属性的前提是必须先获取标签对象,然后又以下两种方式:
- 通过标签对象 . attributeValue(属性名称); 返回一个String value;
- 通过标签 . arrribute(属性值) 返回Attribute(属性)对象,然后通过getName() 或者 getValue方法得到属性名称和属性值 ;
(1)获取值为001的id属性:
(2)获取值为002的id属性
4、获取文本:
要获取文本,首先也要获取标签对象,然后有以下两种方法:
- 标签对象 . getText(); --- 这个方法不常用
- 父标签对象 . elementText("子节点名称") ; --- 这个比较常用
注意:如果文本中包含空格和换行,解析文本信息的时候,空格、换行也属于文本信息 ;
(1)获取zhangsan
5、将xml文件中的concat节点的内容封装成一个java的联系人对象
首先,要封装一个Contact的java类:
/**
* 创建封装一个Contact对象
*/
public class Contact {
private String id ;
private String name ;
private String gender ;
private String phone ;
private String email ;
private String address ;
public Contact() {
}
public void setId(String id) {
this.id = id;
}
public void setName(String name) {
this.name = name;
}
public void setGender(String gender) {
this.gender = gender;
}
public void setPhone(String phone) {
this.phone = phone;
}
public void setEmail(String email) {
this.email = email;
}
public void setAddress(String address) {
this.address = address;
}
// 覆写toString()方法 -- 输出对象
@Override
public String toString() {
return "Contact{" +
"id='" + id + '\'' +
", name='" + name + '\'' +
", gender='" + gender + '\'' +
", phone='" + phone + '\'' +
", email='" + email + '\'' +
", address='" + address + '\'' +
'}';
}
}
然后,获取根节点下的所有concat节点对象,获取其中的文本信息,并赋值给Contact对应的属性值:
public class Test {
public static void main(String[] args) throws DocumentException {
// 获取解析器对象
SAXReader reader = new SAXReader();
// 读xml文件
Document document = reader.read(Test.class.getClassLoader().getResource("contact.xml"));
// 获取根节点下的所有concat对象
List<Element> list = document.getRootElement().elements();
// 用一个List集合,来存储Contact对象
List<Contact> contacts = new ArrayList<>();
// 遍历根节点下是所有concat节点,并取得其中的文本信息,将其赋值给Contact对象对应的属性
for (Element e : list)
{
Contact contact = new Contact();
contact.setId(e.attributeValue("id"));
contact.setName(e.elementText("name"));
contact.setGender(e.elementText("gender"));
contact.setPhone(e.elementText("phone"));
contact.setEmail(e.elementText("emmail"));
contact.setAddress(e.elementText("address"));
contacts.add(contact);
}
for (Contact c : contacts)
{
System.out.println(c);
}
}
}
运行结果:
6、修改XML文件
6.1 添加一个空文档、添加标签、添加属性
(1)添加一个空文档
(2)添加标签、属性、文本信息:
关于里面的两种格式:
- OutputFormat.createPrettyPrint(); 简单格式
- OutputFormat.createCompactFormat(); 复杂格式
6.2 修改:修改属性,修改文本内容
运行结果:
6.3 删除标签
删除标签也分为两种:
- 自杀:当前标签对象.decach() ;
- 他杀:当前标签对象.getParent().remove("标签名称") ;
实例操作:
运行结果: