一、xml的概念:
XML(EXtensible Markup Language),可扩展标记语言,一种数据的交换格式。它的平台无关性、语言无关性、系统无关性。给数据的集成、存储和交互带来了极大的方便。在不同的语言中它的解析方式是一样的,只是语法不一样。
二、xml和html的的差别:
XML 被设计用来传输和存储数据。
HTML 被设计用来显示数据。
三、准备条件
下载地址:http://sourceforge.net/projects/dom4j/
编写一个shcool.xml文档
<?xml version="1.0" encoding="UTF-8"?>
<school id="先锋学院">
<classes id="java001班">
<sudent id="001">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="001">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="002">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
</classes>
<classes id="java002班">
<sudent id="001">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="004">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
</classes>
<classes id="java003班">
<sudent id="001">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="002">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="003">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
</classes>
<classes id="java004班">
<sudent id="004">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
<sudent id="002">
<name>张三</name>
<age>13</age>
<gender>男</gender>
</sudent>
</classes>
</school>
javabeen类
student.java
package domain;
public class Student {
private String id;
private String name ;
private int age;
private String gender;
public Student() {}
public Student(String id, String name, int age, String gender) {
this.id = id;
this.name = name;
this.age = age;
this.gender = gender;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
public String getGender() {
return gender;
}
public void setGender(String gender) {
this.gender = gender;
}
@Override
public String toString() {
return "Student [id=" + id + ", name=" + name + ", age=" + age
+ ", gender=" + gender + "]";
}
}
classes.java
package domain;
import java.util.ArrayList;
public class Classes {
private String id;
ArrayList<Student> sArrayList;
public Classes() {}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public ArrayList<Student> getsArrayList() {
return sArrayList;
}
public void setsArrayList(ArrayList<Student> sArrayList) {
this.sArrayList = sArrayList;
}
}
school类
package domain;
import java.util.ArrayList;
public class School {
private String name;//学校名称
ArrayList<Classes> aClasses ;
public School(){};
public School(String name, ArrayList<Classes> aClasses) {
this.name = name;
this.aClasses = aClasses;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public ArrayList<Classes> getaClasses() {
return aClasses;
}
public void setaClasses(ArrayList<Classes> aClasses) {
this.aClasses = aClasses;
}
}
四、使用DOM实战
DOM(java自带的解析jar包):xml的本质是一种分层结构而dom接口提供了一种通过分层对象模型来访问XML文档信息的方式,这些分层对象模型依据XML的文档结构形成了一棵节点树。无论xml文件中描述的是什么样的类型信息,dom都以节点树的形式去进行解析。当DOM对xml文件进行解析时会把xml文档转化成DOM树放在内存中,所以当xml文档过于大是对内存的需求是比较高的。但是由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,DOM解析还是有很广泛的使用价值
优点:
- 形成了树的结构,容易理解,代码更好编写
- 解析过程中,树结构存在内存中方便修改
缺点:
- 形成可树结构把文档全部加载进了内存,对内存的消耗较大
- 如果xml文档较大(>10M)时,会造成内存溢出
DOM解析代码:
package xml;
import java.util.ArrayList;
import java.util.Iterator;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import domain.Classes;
import domain.School;
import domain.Student;
//DOM解析school
public class XmlStudent {
public static void main(String[] args) throws Exception {
// 获取一个文件工厂实例
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
// 通过文档工厂获取解析器对象
DocumentBuilder documentBuilder = dbFactory.newDocumentBuilder();
// 获取文档路径
Document parse = documentBuilder.parse("src/School.xml");
// 获取xml文档
Element SchoolElement = parse.getDocumentElement();
String schoolname = SchoolElement.getAttribute("id");
System.out.println(schoolname);
// 创建School对象
School school = new School();
school.setName(schoolname);
ArrayList<Classes> classesList = new ArrayList<Classes>();
// 获取school中的直接子节点
NodeList childNodes = SchoolElement.getChildNodes();
// 使用for循环遍历school节点中的子节点(class)
for (int i = 0; i < childNodes.getLength(); i++) {
Node node = childNodes.item(i);
if (node.getNodeType() == 1) {
Element classElement = (Element) node;
String classId = classElement.getAttribute("id");
// 创建一个calss实例
Classes classes = new Classes();
classes.setId(classId);
// 创建一个List集合用于存储student
ArrayList<Student> studentList = new ArrayList<Student>();
// 获取class类的直接子节点
NodeList childNodes1 = classElement.getChildNodes();
// 使用for循环遍历school中的所有子节点
for (int j = 0; j < childNodes1.getLength(); j++) {
Node node1 = childNodes1.item(j);
if (node1.getNodeType() == 1) {
Element studentElement = (Element) node1;
String studentId = studentElement.getAttribute("id");
// 创建一个Student实例
Student student = new Student();
student.setId(studentId);
// 获取student节点中各个节点的属性值
String studentName = studentElement
.getElementsByTagName("name").item(0)
.getTextContent();
String studentAge = studentElement
.getElementsByTagName("age").item(0)
.getTextContent();
String studentGender = studentElement
.getElementsByTagName("gender").item(0)
.getTextContent();
student.setName(studentName);
student.setAge(Integer.parseInt(studentAge));
student.setGender(studentGender);
// 创建student集合将所有的student类存放到ArrayList集合中
studentList.add(student);
}
}
// 完成Classes类的初始化
classes.setsArrayList(studentList);
classesList.add(classes);
}
}
school.setaClasses(classesList);
// 遍历school里面的对象信息,并且将所有的student和class信息打印出来
System.out.println("学校名称:" + school.getName());
System.out.println("----------------------------------");
ArrayList<Classes> getaClasses = school.getaClasses();
Iterator<Classes> iterator = getaClasses.iterator();
while (iterator.hasNext()) {
Classes classes = iterator.next();
System.out.println("班级名称:" +classes.getId());
Iterator<Student> iterator2 = classes.getsArrayList()
.iterator();
while (iterator2.hasNext()) {
Student student = iterator2.next();
System.out.println(student.toString());
}
System.out.println("--------");
}
}
}
五、使用DOM4j实战
dom4j特点:
1、JDOM的一种智能分支,它合并了许多超出基本XML文档表示的功能。
2、它使用接口和抽象基本类方法。
3、具有性能优异、灵活性好、功能强大和极端易用的特点。
4、是一个开放源码的文件
以下是代码:
package xml;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import domain.copy.Classes;
import domain.copy.School;
import domain.copy.Student;
public class ParsStudentXml {
@SuppressWarnings("unchecked")
public static void main(String[] args) throws Exception {
// 创建一个student集合
ArrayList<Student> studentArrList = new ArrayList<Student>();
// 创建一个Sax解析器对象
SAXReader saxReader = new SAXReader();
// 使用解析器读取xml文件
Document document = saxReader.read("src/school.xml");
Element rootElement = document.getRootElement();
// 获取根节点的属性
String schoolId = rootElement.attributeValue("id");
School school = new School();
school.setName(schoolId);
// 通过根节点获取所有的子节点对象
List<Element> classElements = rootElement.elements();
// 遍历班级集合
for (Element classElement : classElements) {
String classId = classElement.attributeValue("id");
Classes classes = new Classes();
classes.setId(classId);
classes.setSchool(school);
// 根据班级节点获取所有的直接子节点
List<Element> studentList = classElement.elements();
for (Element studentElements : studentList) {
String studentId = studentElements.attributeValue("id");
Student student = new Student();
student.setId(studentId);
String studentName = studentElements.element("name").getText();
String studentAge = studentElements.element("age").getText();
String studentGender = studentElements.element("gender")
.getText();
student.setName(studentName);
student.setAge(Integer.parseInt(studentAge));
student.setGender(studentGender);
student.setClasses(classes);
studentArrList.add(student);
}
}
Iterator<Student> iterator = studentArrList.iterator();
while (iterator.hasNext()) {
Student student = iterator.next();
System.out.println(student.toString());
}
}
}