java 解析xml的四种方式:sax,dom,dom4j,jdom

本文主要介绍4种主流的Java解析xml文件的方式,仅供参考,本文待解析的books.xml文件内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
    <book id="1">
        <name>冰与火之歌</name>
        <author>乔治马丁</author>
        <price>88</price>
    </book>

    <book id="2">
        <name>安徒生童话</name>
        <author>安徒生</author>
        <year>2004</year>
    </book>
</bookstore>

1.sax解析xml

1.1 SAXParserHandler.java

package com.demo.xml;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {

    /*
     * 解析开始
     */
    @Override
    public void startDocument() throws SAXException {
        // TODO Auto-generated method stub
        super.startDocument();
        System.out.println("解析开始");
    }

    /*
     * (non-Javadoc)
     * @see org.xml.sax.helpers.DefaultHandler#endDocument()
     * 用来标志解析结束
     */
    @Override
    public void endDocument() throws SAXException {
        // TODO Auto-generated method stub
        super.endDocument();
        System.out.println("解析结束");
    }

    /**
     * 遍历标签开始
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        // TODO Auto-generated method stub
        super.startElement(uri, localName, qName, attributes);

        if(qName.equals("book")){
            //前提,知道book属性名是id
            String value = attributes.getValue("id");
            System.out.println("book下面id属性的值:"+value);

            //不知道
            int num = attributes.getLength();
            System.out.println("book属性个数:"+num);

            //循环遍历book下面的属性
            for (int i = 0; i < num; i++) {
                System.out.println("book节点下的属性名:"+attributes.getQName(i)+"===对应属性值:"+attributes.getValue(i));

            }
        }else if(!qName.equals("book") && !qName.equals("bookstore")){
            System.out.print("book节点下子节点属性名:"+qName+"===");
        }
    }

    @Override
    public void endElement(String uri, String localName, String qName)
            throws SAXException {
        // TODO Auto-generated method stub
        super.endElement(uri, localName, qName);
    }

    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException {
        // TODO Auto-generated method stub
        super.characters(ch, start, length);

        String str = new String(ch,start,length);
        if(!str.trim().equals("")){
            System.out.println("对应的节点值:"+str);
        }

    }


}

1.2 测试类 SAXTest.java

package com.demo.xml;

import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.SAXException;

public class SAXTest {

    public static void main(String[] args) {
        //获取一个SAXParserFactory对象
        SAXParserFactory factory = SAXParserFactory.newInstance();

        try {
            //获取SAXParser对象
            SAXParser parse = factory.newSAXParser();

            SAXParserHandler handle = new SAXParserHandler();
            parse.parse("books.xml", handle);

        } catch (ParserConfigurationException  e) {
            e.printStackTrace();
        } catch ( SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}

运行结果:
解析开始
book下面id属性的值:1
book属性个数:1
book节点下的属性名:id===对应属性值:1
book节点下子节点属性名:name===对应的节点值:冰与火之歌
book节点下子节点属性名:author===对应的节点值:乔治马丁
book节点下子节点属性名:price===对应的节点值:88
book下面id属性的值:2
book属性个数:1
book节点下的属性名:id===对应属性值:2
book节点下子节点属性名:name===对应的节点值:安徒生童话
book节点下子节点属性名:author===对应的节点值:安徒生
book节点下子节点属性名:year===对应的节点值:2004
解析结束

2.dom解析xml

测试类 DomTest.java

package com.demo.xml;

import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomTest {
    public static void main(String[] args) {

        //创建一个DoucmentBuilderFactory对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();


        try {
            //创建一个DocumentBuilder对象
            DocumentBuilder db = dbf.newDocumentBuilder();
            //解析xml文件
            Document document = db.parse("books.xml");
            //开始解析
            NodeList bookList = document.getElementsByTagName("book");
            //遍历NodeList
            System.out.println("book节点个数:"+bookList.getLength());

            for (int i = 0; i < bookList.getLength(); i++) {
                //遍历第i个节点内容
                Node book = bookList.item(i);
                //获取book节点下的属性
                NamedNodeMap attrs = book.getAttributes();
                System.out.println("第"+(i+1)+"本书节点属性个数:"+attrs.getLength());
                for (int j = 0; j < attrs.getLength(); j++) {
                    Node attr = attrs.item(j);
                    System.out.println("获取第"+(i+1)+"本书的属性名:"+attr.getNodeName()+"===对应的属性值:"+attr.getNodeValue());
                }

                //获取book子节点
                NodeList childList = book.getChildNodes();
                System.out.println("获取第"+(i+1)+"本书子节点个数:"+childList.getLength());

                //遍历子节点
                for (int j = 0; j < childList.getLength(); j++) {
                    //获取每一个子节点对象
                    Node node = childList.item(j);

                    if(node.getNodeType() == Element.ELEMENT_NODE){
                        System.out.println("获取第"+(i+1)+"本书子节点名称:"+node.getNodeName()+"===对应的属性值:"+node.getFirstChild().getNodeValue());
                        //System.out.println("获取第"+(i+1)+"本书子节点名称:"+node.getNodeName()+"===对应的属性值:"+node.getTextContent());
                    }

                }

            }

        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        }catch (SAXException e) {
            e.printStackTrace();
        }catch ( IOException e) {
            e.printStackTrace();
        }
    }

}

运行结果:
book节点个数:2
第1本书节点属性个数:1
获取第1本书的属性名:id===对应的属性值:1
获取第1本书子节点个数:7
获取第1本书子节点名称:name===对应的属性值:冰与火之歌
获取第1本书子节点名称:author===对应的属性值:乔治马丁
获取第1本书子节点名称:price===对应的属性值:88
第2本书节点属性个数:1
获取第2本书的属性名:id===对应的属性值:2
获取第2本书子节点个数:7
获取第2本书子节点名称:name===对应的属性值:安徒生童话
获取第2本书子节点名称:author===对应的属性值:安徒生
获取第2本书子节点名称:year===对应的属性值:2004

3.dom4j解析xml

测试类 Dom4jTest.java

package com.demo.xml;

import java.io.File;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Dom4jTest {
    public static void main(String[] args) throws DocumentException {
          SAXReader reader = new SAXReader();
          File file = new File("books.xml");
          Document document = reader.read(file);

          //获取根元素
          Element root = document.getRootElement();
          List<Element> childElements = root.elements();
          for (Element child : childElements) {
           //未知属性名情况下
           List<Attribute> attributeList = child.attributes();
           for (Attribute attr : attributeList) {
                System.out.println(attr.getName() + ": " + attr.getValue());
           }

           //已知属性名情况下
           //System.out.println("id: " + child.attributeValue("id"));

           //未知子元素名情况下
           List<Element> elementList = child.elements();
           for (Element ele : elementList) {
            System.out.println(ele.getName() + ": " + ele.getText());
           }
           System.out.println();

           //已知子元素名的情况下
          /* System.out.println("title" + child.elementText("names"));
           System.out.println("author" + child.elementText("author"));*/
           //这行是为了格式化美观而存在
           System.out.println();
          }
    }

}

运行结果:
id: 1
name: 冰与火之歌
author: 乔治马丁
price: 88

id: 2
name: 安徒生童话
author: 安徒生
year: 2004

4.jdom解析xml

测试类 JDomTest.java

package com.iflytek.xml;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.SAXBuilder;

/**
 * 利用JDom解析xml
 * 
 * @author chendan
 * 
 */
public class JDomTest {

    public static void main(String[] args) throws JDOMException, IOException {
        // JDOM从XML中解析
        SAXBuilder builder = new SAXBuilder();
        // 获得XML文档对象
        Document doc = builder.build(new File("books.xml"));
        // 得到文档根元素
        Element element = doc.getRootElement();

        System.out.println("根节点:" + element.getName());
        // 得到根元素下的book元素
        List book = element.getChildren();

        for (int i = 0; i < book.size(); i++) {

            Element et = (Element) book.get(i);// 循环依次得到子元素

            // 得到book元素的属性
            List attrs = et.getAttributes();
            // 得到book元素属性的名字和值
            for (int k = 0; k < attrs.size(); k++) {
                //获取book节点属性
                Attribute attr = (Attribute) attrs.get(k);
                String attrName = attr.getName();    //属性名
                String attrValue = attr.getValue();  //属性值
                System.out.println("第" + (i + 1) + "个book节点属性名:" + attrName
                        + ",属性值:" + attrValue);
            }

            // 得到book子元素
            List list = et.getChildren();

            //循环得到book节点的子节点
            for (int j = 0; j < list.size(); j++) {
                Element el = (Element) list.get(j);
                System.out.println("book子节点属性名:" + el.getName() + ",属性值:"
                        + el.getValue());

            }
        }

    }

}

运行结果:
根节点:bookstore
第1个book节点属性名:id,属性值:1
book子节点属性名:name,属性值:冰与火之歌
book子节点属性名:author,属性值:乔治马丁
book子节点属性名:price,属性值:88
第2个book节点属性名:id,属性值:2
book子节点属性名:name,属性值:安徒生童话
book子节点属性名:author,属性值:安徒生
book子节点属性名:year,属性值:2004

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值