使用DOM解析XML文件

最新推荐文章于 2022-05-11 09:35:25 发布

zhuxinquan61

最新推荐文章于 2022-05-11 09:35:25 发布

阅读量1.9k

点赞数

分类专栏： JAVA 文章标签： xml dom 标签

本文链接：https://blog.csdn.net/zhuxinquan61/article/details/50555709

版权

JAVA 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

XML是一种可扩展的标记语言，首先它是一种标记语言，类似于HTML，有标签，标签有属性，然而与HTML不同的是XML的标签是可以自己定义的，这样就方便我们存储一些有层次结构的内容！
这里要说的是使用DOM去解析XML文件：
首先，DOM是一种文档对象模型（Document Object Model），使用DOM解析时会将XML文档表示为树状，具有层次性。
如下是一个xml文件的例子：

<?xml version="1.0" encoding="UTF-8"?>
<person>
    <teacher id="1">
        <name>小白</name>
        <desc>小白人</desc>
    </teacher>
    <teacher id="2">
        <name>小黑</name>
        <desc>小黑人</desc>
    </teacher>
</person>

第一行为xml文件声明的头，包括版本号和字符编码
接下来是实体内容，<person>是自定义的标签，里面包含两个teacher标签，id是标签的属性，标签内部可以嵌套使用标签，成为子标签

对一个XML文件解析通常有以下几个步骤：

//首先创建Dom解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//通过解析器工厂创建解析器
DocumentBuilder builder = dbf.newDocumentBuilder();
//创建Document对象开始解析，is为xml文件输入流，解析的过程就如同形成一棵树的过程
Document doc = builder.parse(is);
//根据文档的节点返回NodeList列表
NodeList nodelist =  doc.getElementsByTagName("teacher");

下面是一个例子，通过一个XML文件中的数据创建Teacher对象，Teacher类的定义如下：

package xml;
/**
 * Created by zhuxinquan on 16-1-20.
 */
public class Teacher {
    private int id;
    private String name;
    private String desc;

    @Override
    public String toString() {
        return "Teacher{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", desc='" + desc + '\'' +
                '}';
    }

    public Teacher() {
    }

    public Teacher(int id, String name, String desc) {

        this.id = id;
        this.name = name;
        this.desc = desc;
    }

    public int getId() {

        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getDesc() {
        return desc;
    }

    public void setDesc(String desc) {
        this.desc = desc;
    }
}

下面是解析使用的DomParseDemo类：

package xml;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

/**
 * Created by zhuxinquan on 16-1-20.
 */
public class DomParseDemo {
    /**
     * 一个解析类对应一个xml文件
     * @throws IOException
     * @throws ParserConfigurationException
     * @throws SAXException
     */
    public static void main(String[] args) throws IOException, ParserConfigurationException, SAXException {
        //创建Dom解析器工厂
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        //通过解析器工厂创建解析器
        DocumentBuilder builder = dbf.newDocumentBuilder();
        //构造一个输入流
        InputStream is = new FileInputStream("teacher.xml");
        //开始解析，创建Document对象
        Document doc = builder.parse(is);

        //存储Teacher的集合
        List<Teacher> teachers = new ArrayList<Teacher>();
        Teacher t = null;

        //根据文档的结点获取数据，返回一个NodeList列表
        NodeList nodelist =  doc.getElementsByTagName("teacher");
        for (int i = 0; i < nodelist.getLength(); i++) {
            t = new Teacher();
            //item返回值为一个结点，返回一个Node对象
            Node teachernode =  nodelist.item(i);
            //getAttributes取得当前结点下的所有属性,getNameItem根据属性名称获取当前属性
            String id = teachernode.getAttributes().getNamedItem("id").getNodeValue();
//            System.out.println(id);
            t.setId(Integer.parseInt(id));
            //获取当前节点下的所有子节点列表
            NodeList childNodeList = teachernode.getChildNodes();
            for (int j = 0; j < childNodeList.getLength(); j++) {
                //获取teacher节点下的其中一个子节点
                Node childNode = childNodeList.item(j);
                String tagName = childNode.getNodeName();
                if("name".equals(tagName)){
                    //获取teacher节点下的name节点的值
                    t.setName(childNode.getFirstChild().getNodeValue());
                }else if("desc".equals(tagName)){
                    //获取teacher节点下的desc值
                    t.setDesc(childNode.getFirstChild().getNodeValue());
                }else{
                    System.out.println(childNode.getFirstChild().getNodeValue());
                }
            }
            teachers.add(t);
        }
        System.out.println(teachers);
    }
}

以上是一个比较简单的通过Dom去解析xml文件的例子，对于不同的xml文件需要定义不同的解析器，对于解析xml文件实质就是通过不同的标签获取到不同的内容，对应于最深层子标签中的内容是通过子标签getNodeValue获取的，也就是说，任何标签内的子标签是被当做上层标签的内容一块获取的。
！！初次学习，错误之处还望指正～～～