使用DOM解析XML文件

XML是一种可扩展的标记语言,首先它是一种标记语言,类似于HTML,有标签,标签有属性,然而与HTML不同的是XML的标签是可以自己定义的,这样就方便我们存储一些有层次结构的内容!
这里要说的是使用DOM去解析XML文件:
首先,DOM是一种文档对象模型(Document Object Model),使用DOM解析时会将XML文档表示为树状,具有层次性。
如下是一个xml文件的例子:

<?xml version="1.0" encoding="UTF-8"?>
<person>
    <teacher id="1">
        <name>小白</name>
        <desc>小白人</desc>
    </teacher>
    <teacher id="2">
        <name>小黑</name>
        <desc>小黑人</desc>
    </teacher>
</person>

第一行为xml文件声明的头,包括版本号和字符编码
接下来是实体内容,<person>是自定义的标签,里面包含两个teacher标签,id是标签的属性,标签内部可以嵌套使用标签,成为子标签

对一个XML文件解析通常有以下几个步骤:
//首先创建Dom解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//通过解析器工厂创建解析器
DocumentBuilder builder = dbf.newDocumentBuilder();
//创建Document对象开始解析,is为xml文件输入流,解析的过程就如同形成一棵树的过程
Document doc = builder.parse(is);
//根据文档的节点返回NodeList列表
NodeList nodelist =  doc.getElementsByTagName("teacher");

下面是一个例子,通过一个XML文件中的数据创建Teacher对象,Teacher类的定义如下:

package xml;
/**
 * Created by zhuxinquan on 16-1-20.
 */
public class Teacher {
    private int id;
    private String name;
    private String desc;

    @Override
    public String toString() {
        return "Teacher{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", desc='" + desc + '\'' +
                '}';
    }

    public Teacher() {
    }

    public Teacher(int id, String name, String desc) {

        this.id = id;
        this.name = name;
        this.desc = desc;
    }

    public int getId() {

        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getDesc() {
        return desc;
    }

    public void setDesc(String desc) {
        this.desc = desc;
    }
}

下面是解析使用的DomParseDemo类:

package xml;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

/**
 * Created by zhuxinquan on 16-1-20.
 */
public class DomParseDemo {
    /**
     * 一个解析类对应一个xml文件
     * @throws IOException
     * @throws ParserConfigurationException
     * @throws SAXException
     */
    public static void main(String[] args) throws IOException, ParserConfigurationException, SAXException {
        //创建Dom解析器工厂
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        //通过解析器工厂创建解析器
        DocumentBuilder builder = dbf.newDocumentBuilder();
        //构造一个输入流
        InputStream is = new FileInputStream("teacher.xml");
        //开始解析,创建Document对象
        Document doc = builder.parse(is);

        //存储Teacher的集合
        List<Teacher> teachers = new ArrayList<Teacher>();
        Teacher t = null;

        //根据文档的结点获取数据,返回一个NodeList列表
        NodeList nodelist =  doc.getElementsByTagName("teacher");
        for (int i = 0; i < nodelist.getLength(); i++) {
            t = new Teacher();
            //item返回值为一个结点,返回一个Node对象
            Node teachernode =  nodelist.item(i);
            //getAttributes取得当前结点下的所有属性,getNameItem根据属性名称获取当前属性
            String id = teachernode.getAttributes().getNamedItem("id").getNodeValue();
//            System.out.println(id);
            t.setId(Integer.parseInt(id));
            //获取当前节点下的所有子节点列表
            NodeList childNodeList = teachernode.getChildNodes();
            for (int j = 0; j < childNodeList.getLength(); j++) {
                //获取teacher节点下的其中一个子节点
                Node childNode = childNodeList.item(j);
                String tagName = childNode.getNodeName();
                if("name".equals(tagName)){
                    //获取teacher节点下的name节点的值
                    t.setName(childNode.getFirstChild().getNodeValue());
                }else if("desc".equals(tagName)){
                    //获取teacher节点下的desc值
                    t.setDesc(childNode.getFirstChild().getNodeValue());
                }else{
                    System.out.println(childNode.getFirstChild().getNodeValue());
                }
            }
            teachers.add(t);
        }
        System.out.println(teachers);
    }
}

以上是一个比较简单的通过Dom去解析xml文件的例子,对于不同的xml文件需要定义不同的解析器,对于解析xml文件实质就是通过不同的标签获取到不同的内容,对应于最深层子标签中的内容是通过子标签getNodeValue获取的,也就是说,任何标签内的子标签是被当做上层标签的内容一块获取的。
!!初次学习,错误之处还望指正~~~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值