Dom方式解析XML详解

一、Dom解析XML原理

Dom解析方式是把整个XML文件读入内存生成一个Document(org.w3c.dom.Document)对象代表整个XML文件,再把每一个标签解析成相应的对象并生成一棵DOM树,对XML文件的增删查改操作转化为增删查改DOM树中的节点。
优点:对XML文件的CRUD操作很方便
缺点:占用内存大
开发包:Jaxp(sun公司)


二、Dom解析步骤

1. 获取XML文件对应的Document对象
2. 通过Document对象对内存中的树进行CRUD操作
a.  获取某个特定的节点对象
b. 对该节点采取一列的操作
3. 将内存中的树转化到文件系统储存

样本XML如下(#1):

<?xml version="1.0" encoding="UTF-8" ?> 

<BookDesk> 
        <Book> 
                <name source='www.baidu.com'>Thinking in C++</name> 
                <price>100</price> 
                <author>Acpp</author> 
        </Book> 
        <Book> 
                <name>Java Writing</name> 
                <price>30</price> 
                <author>AJAVA</author> 
        </Book> 
</BookDesk>


三、通过Jaxp API获取Document对象

File xmlFile = new File(filePath);
//XML解析器工厂调用静态方法生成一个XML解析器工厂对象
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//XML解析器工厂对象调用静态方法生成一个XML解析器对象
DocumentBuilder builder = factory.newDocumentBuilder();
//XML解析器对象解析XML文件返回内存中代表XML文件的Document对象
Document document = builder.parse(xmlFile);

四、查找XML中某个节点

//查找所有标签名字为“Book”节点,NodeList对象保留了名字为Book”节点出现的顺序
NodeList list = document.getElementsByTagName("Book");
//获取索引为index的节点对象
Node node = list.item(index(int));
//强制将Node转化为Element 
Element element = (Element)node;
注:document可以看成成是一棵树,document.getDocumentElement()方法即可直接获得这棵树的根节点。每个节点也可使用getElementsByTagName("name")方法查找该节点内部子节点名字为name的标签。

五、对节点进行修改和跟新操作

Element继承Node类,即Element是Node的扩展,可用的方法更多。当某个功能Node类不能实现时,可以将Node强制转换成Element去实现该功能,例如:Node的类不能直接获取标签的属性,更不能去增加和更改一个标签的属性,但是Element可以。
//Node操作举例
node.getNodeName();
node.getParentNode();
node.getTextContent();
//Element操作举例
element.getAttribute("属性名");
element.setAttribute("属性名", "属性值");
element.removeAttribute("属性名");

六、向XML中增加节点

1. 创建节点
Element newElement = document.createElement("price");
newElement.setTextContent("500");
2. 找到需要挂载节点的目标节点
NodeList list = document.getElementsByTagName("Book");
Element element = (Element) list.item(0);
3. 将节点挂载到目标节点的子节点的末尾
element.appendChild(newElement);
注:element.insertBefore(Node newChild, Node refChild);  可将节点指定插入到参照节点refChild之前。
4. 保存:将内存中的DOM树保存到持久化设备
样本XML(#1)运行增加节点方法后如下(#2):
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<BookDesk>
        <Book>
                <name source="WWWXXX">Thinking in C++</name> 
                <price>100</price> 
                <author>Acpp</author> 
                <price>500</price> 
        </Book>
         <Book>
                <name>Java Writing</name> 
                <price>30</price> 
                <author>AJAVA</author> 
        </Book>
</BookDesk>


七、从XML中删除节点

1. 找到要删除的节点
Element element = (Element) document.getElementsByTagName("price").item(1);
2. 删除该节点
//方法1:
//直接通过该节点得到父节点然后再删除该节点
element.getParentNode().removeChild(element);
//方法2:
//通过document得到父节点,再删除该节点
Node node = document.getElementsByTagName("Book").item(0);
node.removeChild(element);
3. 保存:将内存中的XML树保存到持久化设备
XML样本(#2)运行从XML删除节点方法后又得到XML样本(#1)。

八、将内存中的DOM树保存到持久化设备

javax.xml.transform包中Transformer类用于把内存中代表XML的Document对象转化为某种格式后输出。
//获取Transformer工厂对象,在通过该对象获取Transformer对象
TransformerFactory factory = TransformerFactory.newInstance();
Transformer transformer = factory.newTransformer();
//transform.transform方法转换格式并输出
transformer.transform(Source xmlSource, Result outputTarget);
//xmlSource:Document对象;new DOMSource(document)
//outputTarget:输出目标;new StreamResult(文件输出流或File对象)
//转换document对象,保存到持久化设备
transformer.transform(new DOMSource(document), new StreamResult(xmFile));

九、利用XML充当数据库维护数据

本例子程序实现一个简单的学生成绩管理系统,底层利用XML文件维护学生的信息和成绩。本例子实现了底层代码,UI层代码很容易实现未贴出代码。
1.  程序结构如下:

2.  底层XML结构如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<学生信息>
    <学生 姓名="李明" 学号="201207003" 学院="计算机">
        <语文>90</语文>
        <数学>100</数学>
        <英语>90</英语>
        <艺术>92</艺术>
        <计算机>100</计算机>
    </学生>
<学生信息> 
3. 工具类Utils提供了利用Jaxp(sun公司)API Dom解析XML需要的Document对象以及持久化内存中的DOM树的方法
package com.liyin.Utils;
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.*;
import org.xml.sax.SAXException;
/**
 *
 * @author 忘川
 */
public class XmlUtils
{
    private static File xmlFile = new File("./data/Students_XML.xml");
    public static Document getDocument() throws SAXException, ParserConfigurationException, IOException
    {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        return builder.parse(xmlFile);
    }
    public static void savaToXml(Document document) throws TransformerException
    {
        TransformerFactory factory = TransformerFactory.newInstance();
        Transformer transformer = factory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult(xmlFile));
    }
}
4. 数据访问层提供了添加、通过学号删除和查询的方法

package com.liyin.StudentDao;
import com.liyin.Domain.Student;
import com.liyin.Utils.XmlUtils;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
/**
 *
 * @author 忘川
 */
public class StudentDao
{
    public void addStudent(Student student)
    {
        try
        {
            Document document = XmlUtils.getDocument();
            //生成学生结点,并添加三个属性
            Element studentElement = document.createElement("学生");
            studentElement.setAttribute("姓名", student.getName());
            studentElement.setAttribute("学号", student.getStudentId());
            studentElement.setAttribute("学院", student.getAcademy());
            //生成五个科目成绩的结点
            Element chineseElement = document.createElement("语文");
            chineseElement.setTextContent("" + student.getChinese());
            Element mathElement = document.createElement("数学");
            mathElement.setTextContent("" + student.getMath());
            Element englishElement = document.createElement("英语");
            englishElement.setTextContent("" + student.getEnglish());
            Element artElement = document.createElement("艺术");
            artElement.setTextContent("" + student.getArt());
            Element computerElement = document.createElement("计算机");
            computerElement.setTextContent("" + student.getComputer());
            //将五个科目的成绩挂载到学生结点上
            studentElement.appendChild(chineseElement);
            studentElement.appendChild(mathElement);
            studentElement.appendChild(englishElement);
            studentElement.appendChild(artElement);
            studentElement.appendChild(computerElement);
            //将学生节点挂载到根节点上
            document.getDocumentElement().appendChild(studentElement);
            //将内存中的XML树同步到持久设备
            XmlUtils.savaToXml(document);
        } catch (Exception e)
        {
            throw new RuntimeException(e);
        }
    }
    public Student searchStudent(String studentId)
    {
        try
        {
            Document document = XmlUtils.getDocument();
            NodeList list = document.getElementsByTagName("学生");
            //从所有的学生中搜索studentId匹配的学生
            for (int i = 0; i < list.getLength(); i++)
            {
                Element studentElement = (Element) list.item(i);
                if (studentElement.getAttribute("学号").equals(studentId))
                {
                    Student student = new Student();
                    student.setName(studentElement.getAttribute("姓名"));
                    student.setStudentId(studentElement.getAttribute("学号"));
                    student.setAcademy(studentElement.getAttribute("学院"));
                    student.setChinese(Integer.valueOf(studentElement.getElementsByTagName("语文").item(0).getTextContent()));
                    student.setMath(Integer.valueOf(studentElement.getElementsByTagName("数学").item(0).getTextContent()));
                    student.setEnglish(Integer.valueOf(studentElement.getElementsByTagName("英语").item(0).getTextContent()));
                    student.setArt(Integer.valueOf(studentElement.getElementsByTagName("艺术").item(0).getTextContent()));
                    student.setComputer(Integer.valueOf(studentElement.getElementsByTagName("计算机").item(0).getTextContent()));
                    return student;
                }
            }
            return null;
        } catch (Exception e)
        {
            throw new RuntimeException(e);
        }
    }
    public boolean deleteStudent(String studentId)
    {
        try
        {
            Document document = XmlUtils.getDocument();
            NodeList list = document.getElementsByTagName("学生");
            //从所有的学生中搜索studentId匹配的学生
            for (int i = 0; i < list.getLength(); i++)
            {
                Element studentElement = (Element) list.item(i);
                if (studentElement.getAttribute("学号").equals(studentId))
                {
                    //删除匹配的学生
                    studentElement.getParentNode().removeChild(studentElement);
                    XmlUtils.savaToXml(document);
                    return true;
                }
            }
            return false;
        } catch (Exception e)
        {
            throw new RuntimeException(e);
        }
    }
}
5. 实体学生类——Student

package com.liyin.Domain;
/**
 *
 * @author 忘川
 */
public class Student
{
    private String name;
    private String studentId;
    private String academy;
    private int chinese;
    private int math;
    private int english;
    private int art;
    private int computer;
    public String getName()
    {
        return name;
    }
    public void setName(String name)
    {
        this.name = name;
    }
    public String getStudentId()
    {
        return studentId;
    }
    public void setStudentId(String studentId)
    {
        this.studentId = studentId;
    }
    public String getAcademy()
    {
        return academy;
    }
    public void setAcademy(String academy)
    {
        this.academy = academy;
    }
    public int getChinese()
    {
        return chinese;
    }
    public void setChinese(int chinese)
    {
        this.chinese = chinese;
    }
    public int getMath()
    {
        return math;
    }
    public void setMath(int math)
    {
        this.math = math;
    }
    public int getEnglish()
    {
        return english;
    }
    public void setEnglish(int english)
    {
        this.english = english;
    }
    public int getArt()
    {
        return art;
    }
    public void setArt(int art)
    {
        this.art = art;
    }
    public int getComputer()
    {
        return computer;
    }
    public void setComputer(int computer)
    {
        this.computer = computer;
    }
}



没有更多推荐了,返回首页