java解析xml的4种经典方法

最新推荐文章于 2021-02-23 21:39:05 发布

weixin_30326515

最新推荐文章于 2021-02-23 21:39:05 发布

阅读量242

点赞数

文章标签： javascript java ViewUI

原文链接：http://www.cnblogs.com/handsome1013/p/10961489.html

版权

java解析xml的4种经典方法

https://www.jianshu.com/p/9b3835299b99

2…… 比较

    1）DOM4J性能最好，连Sun的JAXM也在用DOM4J.目前许多开源项目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.

    2）JDOM和DOM在性能测试时表现不佳，在测试10M文档时内存溢出。在小文档情况下还值得考虑使用DOM和JDOM.虽然JDOM的开发者已经说明他们期望在正式发行版前专注性能问题，但是从性能观点来看，它确实没有值得推荐之处。另外，DOM仍是一个非常好的选择。DOM实现广泛应用于多种编程语言。它还是许多其它与XML相关的标准的基础，因为它正式获得W3C推荐（与基于非标准的Java模型相对），所以在某些类型的项目中可能也需要它（如在JavaScript中使用DOM）。

    3）SAX表现较好，这要依赖于它特定的解析方式－事件驱动。一个SAX检测即将到来的XML流，但并没有载入到内存（当然当XML流被读入时，会有部分文档暂时隐藏在内存中）。

1、示例XML为hello.xml，如下：

<?xml version="1.0" encoding="UTF-8"?> <bookstore> <book id="1"> <!-- id="1"---属性名和属性值 --> <name>天龙八部</name> <author>金庸</author> <year>2014</year> <price>88</price> </book> <book id="2"> <name>鹿鼎记</name> <year>2015</year> <price>66</price> <language>中文</language> </book> <book id="3"> <name>射雕英雄传</name> <author>金庸</author> <year>2016</year> <price>44</price> </book> </bookstore>

一、DOM（Document Object Model）解析
优点：
1）允许应用程序对数据和结构做出更改。
2）访问是双向的，可以在任何时候再树中上、下导航获取、操作任意部分的数据。
缺点：
解析XML文档的需要加载整个文档来构造层次结构，消耗内存资源大。
应用范围：
遍历能力强，常应用于XML文档需要频繁改变的服务中。

Java使用步骤：

创建一个DocumentBuilderFactory对象。
创建一个DocumentBuilder对象。
通过DocumentBuilder的parse方法加载XML到当前工程目录下。
通过getElementsByTagName方法获取所有XML所有节点的集合。
遍历所有节点。
通过item方法获取某个节点的属性。
通过getNodeName和getNodeValue方法获取属性名和属性值。
通过getChildNodes方法获取子节点，并遍历所有子节点。
通过getNodeName和getTextContent方法获取子节点名称和子节点值。

package Paint;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class DOMTest { public static void main(String[] args) { DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); try { DocumentBuilder db = dbf.newDocumentBuilder(); Document document = db.parse("./src/Paint/hello.xml"); NodeList bookList = document.getElementsByTagName("book");//节点集 int bookCnt = bookList.getLength(); System.err.println("一共获取到" + bookCnt +"本书"); for(int i=0; i<bookCnt; i++){ Node book = bookList.item(i); NamedNodeMap attrs = book.getAttributes(); for(int j=0; j<attrs.getLength(); j++){ Node attr = attrs.item(j); System.err.println(attr.getNodeName()+"---"+attr.getNodeValue());//id } NodeList childNodes = book.getChildNodes(); for(int k=0; k<childNodes.getLength(); k++){ if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE){ System.out.println(childNodes.item(k).getNodeName()+"---" + childNodes.item(k).getTextContent()); } } } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }

二. SAX(Simple API for XML)解析
优点：
1）不需要等待所有的数据被处理，解析就可以开始。
2）只在读取数据时检查数据，不需要保存在内存中。
3）可以在某一个条件满足时停止解析，不必要解析整个文档。
4）效率和性能较高，能解析大于系统内存的文档。
缺点：
1）解析逻辑复杂，需要应用层自己负责逻辑处理，文档越复杂程序越复杂。
2）单向导航，无法定位文档层次，很难同时同时访问同一文档的不同部分数据，不支持XPath.

解析步骤：

获取一个SAXParserFactory的实例。
通过factory获取SAXParser实例。
创建一个handler对象。
通过parser的parse()方法来解析XML。

private String id;
    private String name;
    private String author;
    private String year; private String price; private String language; // getter和setter方法略 }

package Paint;

import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.SAXException; public class SAXTest { public static void main(String[] args) { //获取实例 SAXParserFactory factory = SAXParserFactory.newInstance(); try { SAXParser parser = factory.newSAXParser(); SAXParserHandler handler = new SAXParserHandler(); parser.parse("./src/Paint/hello.xml", handler); System.err.println("共有"+ handler.getBookList().size()+ "本书"); for(Book book : handler.getBookList()){ System.out.println(book.getName()); System.out.println("id=" + book.getId()); System.out.println(book.getAuthor()); System.out.println(book.getYear()); System.out.println(book.getPrice()); System.out.println(book.getLanguage()); } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }

package Paint;

import java.util.ArrayList;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class SAXParserHandler extends DefaultHandler { String value = null; Book book = null; private ArrayList<Book> bookList = new ArrayList<Book>(); public ArrayList<Book> getBookList() { return bookList; } /* * XML解析开始 */ public void startDocument() throws SAXException { super.startDocument(); System.out.println("xml解析开始"); } /* * XML解析结束 */ public void endDocument() throws SAXException { super.endDocument(); System.out.println("xml解析结束"); } /* * 解析XML元素开始 */ public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { super.startElement(uri, localName, qName, attributes); if(qName.equals("book")){ book = new Book(); for(int i=0; i<attributes.getLength();i++){ System.out.println(attributes.getQName(i)+"---"+attributes.getValue(i)); if(attributes.getQName(i).equals("id")){ book.setId(attributes.getValue(i)); } } }else if(!qName.equals("bookstore")){ System.out.print("节点名："+ qName + "---"); } } /* *解析XML元素 结束 */ public void endElement(String uri, String localName, String qName) throws SAXException { super.endElement(uri, localName, qName); if(qName.equals("book")){ bookList.add(book); book = null; } else if(qName.equals("name")){ book.setName(value); }else if(qName.equals("year")){ book.setYear(value); }else if(qName.equals("author")){ book.setAuthor(value); }else if(qName.equals("price")){ book.setPrice(value); }else if(qName.equals("language")){ book.setLanguage(value); } } public void characters(char[] ch, int start, int length) throws SAXException { super.characters(ch, start, length); //获取节点值数组 value = new String(ch, start, length); if(!value.trim().equals("")){ System.out.println("节点值："+value); } } }

三、JDOM解析（需要引入jdom.jar包）
特征：
1、仅使用具体类，而不使用接口。
2、API大量使用了Collections类。
步骤：
1.创建一个SAXBuilder的对象
2.创建一个输入流，将xml文件加载到输入流中
3.通过saxBuilder的build方法，将输入流加载到saxBuilder中
4.通过document对象获取xml文件的根节点
5.获取根节点下的子节点的List集合

package Paint;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List; import org.jdom.Attribute; import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; public class JDOMTest { private static ArrayList<Book> booksList = new ArrayList<Book>(); public static void main(String[] args) { SAXBuilder saxBuilder = new SAXBuilder(); InputStream in; try { in = new FileInputStream("./src/Paint/hello.xml"); InputStreamReader isr = new InputStreamReader(in, "UTF-8"); Document document = saxBuilder.build(isr); Element rootElement = document.getRootElement(); List<Element> bookList = rootElement.getChildren(); for (Element book : bookList) { Book bookEntity = new Book(); List<Attribute> attrList = book.getAttributes(); for (Attribute attr : attrList) { String attrName = attr.getName(); String attrValue = attr.getValue(); System.out.println( attrName + "----" + attrValue); if (attrName.equals("id")) { bookEntity.setId(attrValue); } } // 对book节点的子节点的节点名以及节点值的遍历 List<Element> bookChilds = book.getChildren(); for (Element child : bookChilds) { System.out.println(child.getName() + "----"+ child.getValue()); if (child.getName().equals("name")) { bookEntity.setName(child.getValue()); } else if (child.getName().equals("author")) { bookEntity.setAuthor(child.getValue()); } else if (child.getName().equals("year")) { bookEntity.setYear(child.getValue()); } else if (child.getName().equals("price")) { bookEntity.setPrice(child.getValue()); } else if (child.getName().equals("language")) { bookEntity.setLanguage(child.getValue()); } } booksList.add(bookEntity); bookEntity = null; System.out.println(booksList.size()); System.out.println(booksList.get(0).getId()); System.out.println(booksList.get(0).getName()); } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (JDOMException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }

四、 DOM4J（Document Object Model for Java）解析（需要引入dom4j-1.6.1.jar）
优点：

性能很好
大量使用Java集合类，开发简便，同时也提供了一些提高性能的代替方法。
支持XPath。
缺点：
API比较复杂。
步骤：
1.创建SAXReader的对象reader
2.通过reader对象的read（）方法加载books.xml文件，获取document对象
3.通过document对象获取根节点bookstore
4.通过element对象的elementIterator获取迭代器
5.遍历迭代器，获取根节点中的信息
6.获取book的属性名和属性值
7.通过book对象的elementIterator获取节点元素迭代器
8.遍历迭代器，获取子节点中的信息
9.获取节点名和节点值

package Paint;

import java.io.File;
import java.util.ArrayList;
import java.util.Iterator; import java.util.List; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class DOM4JTest { public static void main(String[] args) { ArrayList<Book> bookList = new ArrayList<Book>(); SAXReader reader = new SAXReader(); try { Document document = reader.read(new File("./src/Paint/hello.xml")); Element bookStore = document.getRootElement(); Iterator it = bookStore.elementIterator(); while (it.hasNext()) { Element book = (Element) it.next(); Book bookData = new Book(); List<Attribute> bookAttrs = book.attributes(); for (Attribute attr : bookAttrs) { System.out.println(attr.getName() + "---" + attr.getValue()); if(attr.getName().equals("id")){ bookData.setId(attr.getValue()); } } Iterator itt = book.elementIterator(); while (itt.hasNext()) { Element bookChild = (Element) itt.next(); System.out.println(bookChild.getName()+ "---" + bookChild.getText()); if(bookChild.getName().equals("name")){ bookData.setName(bookChild.getText()); }else if(bookChild.getName().equals("author")){ bookData.setAuthor(bookChild.getText()); }else if(bookChild.getName().equals("year")){ bookData.setYear(bookChild.getText()); }else if(bookChild.getName().equals("price")){ bookData.setPrice(bookChild.getText()); }else if(bookChild.getName().equals("language")){ bookData.setLanguage(bookChild.getText()); } } //遍历完一个节点，将该节点信息添加到列表中 bookList.add(bookData); } } catch (DocumentException e) { e.printStackTrace(); } //输出保存在内存中XML信息 for(Book book:bookList){ System.out.println(book.getName()); System.out.println("id=" + book.getId()); System.out.println(book.getAuthor()); System.out.println(book.getYear()); System.out.println(book.getPrice()); System.out.println(book.getLanguage()); } } }

小礼物走一走，来简书关注我

作者：莫问以
链接：https://www.jianshu.com/p/9b3835299b99
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

转载于:https://www.cnblogs.com/handsome1013/p/10961489.html

weixin_30326515

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java解析xml的4种经典方法

java解析xml的4种经典方法https://www.jianshu.com/p/9b3835299b99 2……比较1）DOM4J性能最好，连Sun的JAXM也在用DOM4J.目前许多开源项目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.2）JDOM和DOM在性能测试时...
复制链接

扫一扫