使用DOM和DOM4J解析xml文档

最新推荐文章于 2021-08-09 17:20:16 发布

千里足下）-

最新推荐文章于 2021-08-09 17:20:16 发布

阅读量450

点赞数

分类专栏： java 文章标签： xml解析

本文链接：https://blog.csdn.net/weixin_41557366/article/details/84141180

版权

java 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、xml的概念：

XML（EXtensible Markup Language）,可扩展标记语言,一种数据的交换格式。它的平台无关性、语言无关性、系统无关性。给数据的集成、存储和交互带来了极大的方便。在不同的语言中它的解析方式是一样的，只是语法不一样。

二、xml和html的的差别：

XML 被设计用来传输和存储数据。

HTML 被设计用来显示数据。

三、准备条件

下载地址：http://sourceforge.net/projects/dom4j/

编写一个shcool.xml文档

<?xml version="1.0" encoding="UTF-8"?>

<school id="先锋学院">
	<classes id="java001班">
		<sudent id="001">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="001">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="002">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
	</classes>
	<classes id="java002班">
		<sudent id="001">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="004">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
	</classes>
	<classes id="java003班">
		<sudent id="001">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="002">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="003">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
	</classes>
	<classes id="java004班">
		<sudent id="004">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
		<sudent id="002">
			<name>张三</name>
			<age>13</age>
			<gender>男</gender>
		</sudent>
	</classes>
</school>

javabeen类

student.java

package domain;


public class Student {
	private String id;
	private String name ;
	private int age;
	private String gender;
	
	public Student() {}

	public Student(String id, String name, int age, String gender) {
		this.id = id;
		this.name = name;
		this.age = age;
		this.gender = gender;
	}

	public String getId() {
		return id;
	}

	public void setId(String id) {
		this.id = id;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	public String getGender() {
		return gender;
	}

	public void setGender(String gender) {
		this.gender = gender;
	}

	@Override
	public String toString() {
		return "Student [id=" + id + ", name=" + name + ", age=" + age
				+ ", gender=" + gender + "]";
	}
	
	
	
}

classes.java

package domain;

import java.util.ArrayList;

public class Classes {
	private String id;
	ArrayList<Student>  sArrayList;
	public Classes() {}
	public String getId() {
		return id;
	}
	public void setId(String id) {
		this.id = id;
	}
	public ArrayList<Student> getsArrayList() {
		return sArrayList;
	}
	public void setsArrayList(ArrayList<Student> sArrayList) {
		this.sArrayList = sArrayList;
	}
	
	
}

school类

package domain;

import java.util.ArrayList;

public class School {
	private String name;//学校名称
	ArrayList<Classes> aClasses ;
	public School(){};
	public School(String name, ArrayList<Classes> aClasses) {
		this.name = name;
		this.aClasses = aClasses;
	}
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
	public ArrayList<Classes> getaClasses() {
		return aClasses;
	}
	public void setaClasses(ArrayList<Classes> aClasses) {
		this.aClasses = aClasses;
	}
}

四、使用DOM实战

DOM(java自带的解析jar包)：xml的本质是一种分层结构而dom接口提供了一种通过分层对象模型来访问XML文档信息的方式，这些分层对象模型依据XML的文档结构形成了一棵节点树。无论xml文件中描述的是什么样的类型信息，dom都以节点树的形式去进行解析。当DOM对xml文件进行解析时会把xml文档转化成DOM树放在内存中，所以当xml文档过于大是对内存的需求是比较高的。但是由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合，同时鉴于随机访问所带来的方便，DOM解析还是有很广泛的使用价值

优点：

形成了树的结构，容易理解，代码更好编写
解析过程中，树结构存在内存中方便修改

缺点：

形成可树结构把文档全部加载进了内存，对内存的消耗较大
如果xml文档较大（>10M）时，会造成内存溢出

DOM解析代码：

package xml;

import java.util.ArrayList;
import java.util.Iterator;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import domain.Classes;
import domain.School;
import domain.Student;

//DOM解析school
public class XmlStudent {

	public static void main(String[] args) throws Exception {

		// 获取一个文件工厂实例
		DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
		// 通过文档工厂获取解析器对象
		DocumentBuilder documentBuilder = dbFactory.newDocumentBuilder();
		// 获取文档路径
		Document parse = documentBuilder.parse("src/School.xml");
		// 获取xml文档
		Element SchoolElement = parse.getDocumentElement();
		String schoolname = SchoolElement.getAttribute("id");
		System.out.println(schoolname);
		// 创建School对象
		School school = new School();
		school.setName(schoolname);
		ArrayList<Classes> classesList = new ArrayList<Classes>();
		// 获取school中的直接子节点
		NodeList childNodes = SchoolElement.getChildNodes();
		// 使用for循环遍历school节点中的子节点（class）
		for (int i = 0; i < childNodes.getLength(); i++) {
			Node node = childNodes.item(i);
			if (node.getNodeType() == 1) {
				Element classElement = (Element) node;
				String classId = classElement.getAttribute("id");
				// 创建一个calss实例
				Classes classes = new Classes();
				classes.setId(classId);
				// 创建一个List集合用于存储student
				ArrayList<Student> studentList = new ArrayList<Student>();
				// 获取class类的直接子节点
				NodeList childNodes1 = classElement.getChildNodes();
				// 使用for循环遍历school中的所有子节点
				for (int j = 0; j < childNodes1.getLength(); j++) {
					Node node1 = childNodes1.item(j);
					if (node1.getNodeType() == 1) {
						Element studentElement = (Element) node1;
						String studentId = studentElement.getAttribute("id");
						// 创建一个Student实例
						Student student = new Student();
						student.setId(studentId);
						// 获取student节点中各个节点的属性值
						String studentName = studentElement
								.getElementsByTagName("name").item(0)
								.getTextContent();
						String studentAge = studentElement
								.getElementsByTagName("age").item(0)
								.getTextContent();
						String studentGender = studentElement
								.getElementsByTagName("gender").item(0)
								.getTextContent();

						student.setName(studentName);
						student.setAge(Integer.parseInt(studentAge));
						student.setGender(studentGender);

						// 创建student集合将所有的student类存放到ArrayList集合中
						studentList.add(student);

					}
				}
				// 完成Classes类的初始化
				classes.setsArrayList(studentList);

				classesList.add(classes);

			}
		}

		school.setaClasses(classesList);
		// 遍历school里面的对象信息，并且将所有的student和class信息打印出来
		System.out.println("学校名称：" + school.getName());
		System.out.println("----------------------------------");
		ArrayList<Classes> getaClasses = school.getaClasses();
		Iterator<Classes> iterator = getaClasses.iterator();
		while (iterator.hasNext()) {
			Classes classes = iterator.next();
			System.out.println("班级名称：" +classes.getId());
			Iterator<Student> iterator2 = classes.getsArrayList()
					.iterator();
			while (iterator2.hasNext()) {
				Student student = iterator2.next();
				System.out.println(student.toString());
			}
			System.out.println("--------");
		}

	}

}

五、使用DOM4j实战

dom4j特点：

　　　　　　1、JDOM的一种智能分支，它合并了许多超出基本XML文档表示的功能。

　　　　　　2、它使用接口和抽象基本类方法。

　　　　　　3、具有性能优异、灵活性好、功能强大和极端易用的特点。

　　　　　　4、是一个开放源码的文件

以下是代码：

package xml;

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import domain.copy.Classes;
import domain.copy.School;
import domain.copy.Student;

public class ParsStudentXml {
	@SuppressWarnings("unchecked")
	public static void main(String[] args) throws Exception {
		// 创建一个student集合
		ArrayList<Student> studentArrList = new ArrayList<Student>();
		// 创建一个Sax解析器对象
		SAXReader saxReader = new SAXReader();
		// 使用解析器读取xml文件
		Document document = saxReader.read("src/school.xml");
		Element rootElement = document.getRootElement();
		// 获取根节点的属性
		String schoolId = rootElement.attributeValue("id");
		School school = new School();
		school.setName(schoolId);
		// 通过根节点获取所有的子节点对象
		List<Element> classElements = rootElement.elements();
		// 遍历班级集合
		for (Element classElement : classElements) {
			String classId = classElement.attributeValue("id");
			Classes classes = new Classes();
			classes.setId(classId);
			classes.setSchool(school);
			// 根据班级节点获取所有的直接子节点
			List<Element> studentList = classElement.elements();
			for (Element studentElements : studentList) {
				String studentId = studentElements.attributeValue("id");

				Student student = new Student();
				student.setId(studentId);

				String studentName = studentElements.element("name").getText();
				String studentAge = studentElements.element("age").getText();
				String studentGender = studentElements.element("gender")
						.getText();

				student.setName(studentName);
				student.setAge(Integer.parseInt(studentAge));
				student.setGender(studentGender);
				student.setClasses(classes);

				studentArrList.add(student);
			}

		}
		Iterator<Student> iterator = studentArrList.iterator();
		while (iterator.hasNext()) {
			Student student = iterator.next();
			System.out.println(student.toString());
		}
	}
}

千里足下）-

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用DOM和DOM4J解析xml文档

一、xml的概念：XML（EXtensible Markup Language）,可扩展标记语言,一种数据的交换格式。它的平台无关性、语言无关性、系统无关性。给数据的集成、存储和交互带来了极大的方便。在不同的语言中它的解析方式是一样的，只是语法不一样。二、xml和html的的差别：XML 被设计用来传输和存储数据。HTML 被设计用来显示数据。三、准备条件下载地址：http...
复制链接

扫一扫