JAVA 解析 XML的四种方法

转载自:http://blog.sina.com.cn/s/blog_62339a24010163ny.html

【引言】

目前在Java中用于解析XML的技术很多,主流的有DOM、SAX、JDOM、DOM4j,下文主要介绍这4种解析XML文档技术的使用、优缺点及性能测试。

一、【基础知识——扫盲】

sax、dom是两种对xml文档进行解析的方法(没有具体实现,只是接口),所以只有它们是无法解析xml文档的;jaxp只是api,它进一步封装了 sax、dom两种接口,并且提供了DomcumentBuilderFactory/DomcumentBuilder和 SAXParserFactory/SAXParser(默认使用xerces解释器)。

二、【DOM、SAX、JDOM、DOM4j简单使用介绍】

1、【DOM(Document Object Model) 】
由W3C提供的接口,它将整个XML文档读入内存,构建一个DOM树来对各个节点(Node)进行操作。
示例代码:
  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <university name="pku">
  3. <college name="c1">
  4. <class name="class1">
  5. <student name="stu1" sex='male' age="21" />
  6. <student name="stu2" sex='female' age="20" />
  7. <student name="stu3" sex='female' age="20" />
  8. </class>
  9. <class name="class2">
  10. <student name="stu4" sex='male' age="19" />
  11. <student name="stu5" sex='female' age="20" />
  12. <student name="stu6" sex='female' age="21" />
  13. </class>
  14. </college>
  15. <college name="c2">
  16. <class name="class3">
  17. <student name="stu7" sex='male' age="20" />
  18. </class>
  19. </college>
  20. <college name="c3">
  21. </college>
  22. </university>
后文代码中有使用到text.xml(该文档放在src路径下,既编译后在classes路径下),都是指该xml文档。
  1. package test.xml;
  2. import java.io.File;
  3. import java.io.FileNotFoundException;
  4. import java.io.FileOutputStream;
  5. import java.io.IOException;
  6. import java.io.InputStream;
  7. import javax.xml.parsers.DocumentBuilder;
  8. import javax.xml.parsers.DocumentBuilderFactory;
  9. import javax.xml.parsers.ParserConfigurationException;
  10. import javax.xml.transform.Transformer;
  11. import javax.xml.transform.TransformerConfigurationException;
  12. import javax.xml.transform.TransformerException;
  13. import javax.xml.transform.TransformerFactory;
  14. import javax.xml.transform.dom.DOMSource;
  15. import javax.xml.transform.stream.StreamResult;
  16. import org.w3c.dom.Document;
  17. import org.w3c.dom.Element;
  18. import org.w3c.dom.Node;
  19. import org.w3c.dom.NodeList;
  20. import org.w3c.dom.Text;
  21. import org.xml.sax.SAXException;
  22. public class TestDom {
  23. public static void main(String[] args) {
  24. read();
  25. //write();
  26. }
  27. public static void read() {
  28. DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
  29. try {
  30. DocumentBuilder builder = dbf.newDocumentBuilder();
  31. InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");
  32. Document doc = builder.parse(in);
  33. // root <university>
  34. Element root = doc.getDocumentElement();
  35. if (root == null) return;
  36. System.err.println(root.getAttribute("name"));
  37. // all college node
  38. NodeList collegeNodes = root.getChildNodes();
  39. if (collegeNodes == null) return;
  40. for(int i = 0; i < collegeNodes.getLength(); i++) {
  41. Node college = collegeNodes.item(i);
  42. if (college != null && college.getNodeType() == Node.ELEMENT_NODE) {
  43. System.err.println("\t" + college.getAttributes().getNamedItem("name").getNodeValue());
  44. // all class node
  45. NodeList classNodes = college.getChildNodes();
  46. if (classNodes == null) continue;
  47. for (int j = 0; j < classNodes.getLength(); j++) {
  48. Node clazz = classNodes.item(j);
  49. if (clazz != null && clazz.getNodeType() == Node.ELEMENT_NODE) {
  50. System.err.println("\t\t" + clazz.getAttributes().getNamedItem("name").getNodeValue());
  51. // all student node
  52. NodeList studentNodes = clazz.getChildNodes();
  53. if (studentNodes == null) continue;
  54. for (int k = 0; k < studentNodes.getLength(); k++) {
  55. Node student = studentNodes.item(k);
  56. if (student != null && student.getNodeType() == Node.ELEMENT_NODE) {
  57. System.err.print("\t\t\t" + student.getAttributes().getNamedItem("name").getNodeValue());
  58. System.err.print(" " + student.getAttributes().getNamedItem("sex").getNodeValue());
  59. System.err.println(" " + student.getAttributes().getNamedItem("age").getNodeValue());
  60. }
  61. }
  62. }
  63. }
  64. }
  65. }
  66. } catch (ParserConfigurationException e) {
  67. e.printStackTrace();
  68. } catch (FileNotFoundException e) {
  69. e.printStackTrace();
  70. } catch (SAXException e) {
  71. e.printStackTrace();
  72. } catch (IOException e) {
  73. e.printStackTrace();
  74. }
  75. }
  76. public static void write() {
  77. DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
  78. try {
  79. DocumentBuilder builder = dbf.newDocumentBuilder();
  80. InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");
  81. Document doc = builder.parse(in);
  82. // root <university>
  83. Element root = doc.getDocumentElement();
  84. if (root == null) return;
  85. // 修改属性
  86. root.setAttribute("name", "tsu");
  87. NodeList collegeNodes = root.getChildNodes();
  88. if (collegeNodes != null) {
  89. for (int i = 0; i <collegeNodes.getLength() - 1; i++) {
  90. // 删除节点
  91. Node college = collegeNodes.item(i);
  92. if (college.getNodeType() == Node.ELEMENT_NODE) {
  93. String collegeName = college.getAttributes().getNamedItem("name").getNodeValue();
  94. if ("c1".equals(collegeName) || "c2".equals(collegeName)) {
  95. root.removeChild(college);
  96. } else if ("c3".equals(collegeName)) {
  97. Element newChild = doc.createElement_x("class");
  98. newChild.setAttribute("name", "c4");
  99. college.appendChild(newChild);
  100. }
  101. }
  102. }
  103. }
  104. // 新增节点
  105. Element addCollege = doc.createElement_x("college");
  106. addCollege.setAttribute("name", "c5");
  107. root.appendChild(addCollege);
  108. Text text = doc.createTextNode("text");
  109. addCollege.appendChild(text);
  110. // 将修改后的文档保存到文件
  111. TransformerFactory transFactory = TransformerFactory.newInstance();
  112. Transformer transFormer = transFactory.newTransformer();
  113. DOMSource domSource = new DOMSource(doc);
  114. File file = new File("src/dom-modify.xml");
  115. if (file.exists()) {
  116. file.delete();
  117. }
  118. file.createNewFile();
  119. FileOutputStream out = new FileOutputStream(file);
  120. StreamResult xmlResult = new StreamResult(out);
  121. transFormer.transform(domSource, xmlResult);
  122. System.out.println(file.getAbsolutePath());
  123. } catch (ParserConfigurationException e) {
  124. e.printStackTrace();
  125. } catch (SAXException e) {
  126. e.printStackTrace();
  127. } catch (IOException e) {
  128. e.printStackTrace();
  129. } catch (TransformerConfigurationException e) {
  130. e.printStackTrace();
  131. } catch (TransformerException e) {
  132. e.printStackTrace();
  133. }
  134. }
  135. }
该代码只要稍做修改,即可变得更加简洁,无需一直写if来判断是否有子节点。

2、【SAX (Simple API for XML) 】
SAX不用将整个文档加载到内存,基于事件驱动的API(Observer模式),用户只需要注册自己感兴趣的事件即可。SAX提供 EntityResolver, DTDHandler, ContentHandler, ErrorHandler接口,分别用于监听解析实体事件、DTD处理事件、正文处理事件和处理出错事件,与AWT类似,SAX还提供了一个对这4个接口默认的类DefaultHandler(这里的默认实现,其实就是一个空方法),一般只要继承DefaultHandler,重写自己感兴趣的事件即可。
示例代码:
  1. package test.xml;
  2. import java.io.IOException;
  3. import java.io.InputStream;
  4. import javax.xml.parsers.ParserConfigurationException;
  5. import javax.xml.parsers.SAXParser;
  6. import javax.xml.parsers.SAXParserFactory;
  7. import org.xml.sax.Attributes;
  8. import org.xml.sax.InputSource;
  9. import org.xml.sax.Locator;
  10. import org.xml.sax.SAXException;
  11. import org.xml.sax.SAXParseException;
  12. import org.xml.sax.helpers.DefaultHandler;
  13. public class TestSAX {
  14. public static void main(String[] args) {
  15. read();
  16. write();
  17. }
  18. public static void read() {
  19. try {
  20. SAXParserFactory factory = SAXParserFactory.newInstance();
  21. SAXParser parser = factory.newSAXParser();
  22. InputStream in = TestSAX.class.getClassLoader().getResourceAsStream("test.xml");
  23. parser.parse(in, new MyHandler());
  24. } catch (ParserConfigurationException e) {
  25. e.printStackTrace();
  26. } catch (SAXException e) {
  27. e.printStackTrace();
  28. } catch (IOException e) {
  29. e.printStackTrace();
  30. }
  31. }
  32. public static void write() {
  33. System.err.println("纯SAX对于写操作无能为力");
  34. }
  35. }
  36. // 重写对自己感兴趣的事件处理方法
  37. class MyHandler extends DefaultHandler {
  38. @Override
  39. public InputSource resolveEntity(String publicId, String systemId)
  40. throws IOException, SAXException {
  41. return super.resolveEntity(publicId, systemId);
  42. }
  43. @Override
  44. public void notationDecl(String name, String publicId, String systemId)
  45. throws SAXException {
  46. super.notationDecl(name, publicId, systemId);
  47. }
  48. @Override
  49. public void unparsedEntityDecl(String name, String publicId,
  50. String systemId, String notationName) throws SAXException {
  51. super.unparsedEntityDecl(name, publicId, systemId, notationName);
  52. }
  53. @Override
  54. public void setDocumentLocator(Locator locator) {
  55. super.setDocumentLocator(locator);
  56. }
  57. @Override
  58. public void startDocument() throws SAXException {
  59. System.err.println("开始解析文档");
  60. }
  61. @Override
  62. public void endDocument() throws SAXException {
  63. System.err.println("解析结束");
  64. }
  65. @Override
  66. public void startPrefixMapping(String prefix, String uri)
  67. throws SAXException {
  68. super.startPrefixMapping(prefix, uri);
  69. }
  70. @Override
  71. public void endPrefixMapping(String prefix) throws SAXException {
  72. super.endPrefixMapping(prefix);
  73. }
  74. @Override
  75. public void startElement(String uri, String localName, String qName,
  76. Attributes attributes) throws SAXException {
  77. System.err.print("Element: " + qName + ", attr: ");
  78. print(attributes);
  79. }
  80. @Override
  81. public void endElement(String uri, String localName, String qName)
  82. throws SAXException {
  83. super.endElement(uri, localName, qName);
  84. }
  85. @Override
  86. public void characters(char[] ch, int start, int length)
  87. throws SAXException {
  88. super.characters(ch, start, length);
  89. }
  90. @Override
  91. public void ignorableWhitespace(char[] ch, int start, int length)
  92. throws SAXException {
  93. super.ignorableWhitespace(ch, start, length);
  94. }
  95. @Override
  96. public void processingInstruction(String target, String data)
  97. throws SAXException {
  98. super.processingInstruction(target, data);
  99. }
  100. @Override
  101. public void skippedEntity(String name) throws SAXException {
  102. super.skippedEntity(name);
  103. }
  104. @Override
  105. public void warning(SAXParseException e) throws SAXException {
  106. super.warning(e);
  107. }
  108. @Override
  109. public void error(SAXParseException e) throws SAXException {
  110. super.error(e);
  111. }
  112. @Override
  113. public void fatalError(SAXParseException e) throws SAXException {
  114. super.fatalError(e);
  115. }
  116. private void print(Attributes attrs) {
  117. if (attrs == null) return;
  118. System.err.print("[");
  119. for (int i = 0; i < attrs.getLength(); i++) {
  120. System.err.print(attrs.getQName(i) + " = " + attrs.getValue(i));
  121. if (i != attrs.getLength() - 1) {
  122. System.err.print(", ");
  123. }
  124. }
  125. System.err.println("]");
  126. }
  127. }
3、【JDOM】
JDOM与DOM非常类似,它是处理XML的纯JAVA API,API大量使用了Collections类,且JDOM仅使用具体类而不使用接口。 JDOM 它自身不包含解析器。它通常使用 SAX2 解析器来解析和验证输入 XML 文档(尽管它还可以将以前构造的 DOM 表示作为输入)。它包含一些转换器以将 JDOM 表示输出成 SAX2 事件流、DOM 模型或 XML 文本文档
示例代码:
  1. package test.xml;
  2. import java.io.File;
  3. import java.io.FileOutputStream;
  4. import java.io.IOException;
  5. import java.io.InputStream;
  6. import java.util.List;
  7. import org.jdom.Attribute;
  8. import org.jdom.Document;
  9. import org.jdom.Element;
  10. import org.jdom.JDOMException;
  11. import org.jdom.input.SAXBuilder;
  12. import org.jdom.output.XMLOutputter;
  13. public class TestJDom {
  14. public static void main(String[] args) {
  15. //read();
  16. write();
  17. }
  18. public static void read() {
  19. try {
  20. boolean validate = false;
  21. SAXBuilder builder = new SAXBuilder(validate);
  22. InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");
  23. Document doc = builder.build(in);
  24. // 获取根节点 <university>
  25. Element root = doc.getRootElement();
  26. readNode(root, "");
  27. } catch (JDOMException e) {
  28. e.printStackTrace();
  29. } catch (IOException e) {
  30. e.printStackTrace();
  31. }
  32. }
  33. @SuppressWarnings("unchecked")
  34. public static void readNode(Element root, String prefix) {
  35. if (root == null) return;
  36. // 获取属性
  37. List<Attribute> attrs = root.getAttributes();
  38. if (attrs != null && attrs.size() > 0) {
  39. System.err.print(prefix);
  40. for (Attribute attr : attrs) {
  41. System.err.print(attr.getValue() + " ");
  42. }
  43. System.err.println();
  44. }
  45. // 获取他的子节点
  46. List<Element> childNodes = root.getChildren();
  47. prefix += "\t";
  48. for (Element e : childNodes) {
  49. readNode(e, prefix);
  50. }
  51. }
  52. public static void write() {
  53. boolean validate = false;
  54. try {
  55. SAXBuilder builder = new SAXBuilder(validate);
  56. InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");
  57. Document doc = builder.build(in);
  58. // 获取根节点 <university>
  59. Element root = doc.getRootElement();
  60. // 修改属性
  61. root.setAttribute("name", "tsu");
  62. // 删除
  63. boolean isRemoved = root.removeChildren("college");
  64. System.err.println(isRemoved);
  65. // 新增
  66. Element newCollege = new Element("college");
  67. newCollege.setAttribute("name", "new_college");
  68. Element newClass = new Element("class");
  69. newClass.setAttribute("name", "ccccc");
  70. newCollege.addContent(newClass);
  71. root.addContent(newCollege);
  72. XMLOutputter out = new XMLOutputter();
  73. File file = new File("src/jdom-modify.xml");
  74. if (file.exists()) {
  75. file.delete();
  76. }
  77. file.createNewFile();
  78. FileOutputStream fos = new FileOutputStream(file);
  79. out.output(doc, fos);
  80. } catch (JDOMException e) {
  81. e.printStackTrace();
  82. } catch (IOException e) {
  83. e.printStackTrace();
  84. }
  85. }
  86. }
4、【DOM4j】
dom4j是目前在xml解析方面是最优秀的(Hibernate、Sun的JAXM也都使用dom4j来解析XML),它合并了许多超出基本 XML 文档表示的功能,包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理
示例代码:
  1. package test.xml;
  2. import java.io.File;
  3. import java.io.FileWriter;
  4. import java.io.IOException;
  5. import java.io.InputStream;
  6. import java.util.List;
  7. import org.dom4j.Attribute;
  8. import org.dom4j.Document;
  9. import org.dom4j.DocumentException;
  10. import org.dom4j.DocumentHelper;
  11. import org.dom4j.Element;
  12. import org.dom4j.ProcessingInstruction;
  13. import org.dom4j.VisitorSupport;
  14. import org.dom4j.io.SAXReader;
  15. import org.dom4j.io.XMLWriter;
  16. public class TestDom4j {
  17. public static void main(String[] args) {
  18. read1();
  19. //read2();
  20. //write();
  21. }
  22. public static void read1() {
  23. try {
  24. SAXReader reader = new SAXReader();
  25. InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");
  26. Document doc = reader.read(in);
  27. Element root = doc.getRootElement();
  28. readNode(root, "");
  29. } catch (DocumentException e) {
  30. e.printStackTrace();
  31. }
  32. }
  33. @SuppressWarnings("unchecked")
  34. public static void readNode(Element root, String prefix) {
  35. if (root == null) return;
  36. // 获取属性
  37. List<Attribute> attrs = root.attributes();
  38. if (attrs != null && attrs.size() > 0) {
  39. System.err.print(prefix);
  40. for (Attribute attr : attrs) {
  41. System.err.print(attr.getValue() + " ");
  42. }
  43. System.err.println();
  44. }
  45. // 获取他的子节点
  46. List<Element> childNodes = root.elements();
  47. prefix += "\t";
  48. for (Element e : childNodes) {
  49. readNode(e, prefix);
  50. }
  51. }
  52. public static void read2() {
  53. try {
  54. SAXReader reader = new SAXReader();
  55. InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");
  56. Document doc = reader.read(in);
  57. doc.accept(new MyVistor());
  58. } catch (DocumentException e) {
  59. e.printStackTrace();
  60. }
  61. }
  62. public static void write() {
  63. try {
  64. // 创建一个xml文档
  65. Document doc = DocumentHelper.createDocument();
  66. Element university = doc.addElement("university");
  67. university.addAttribute("name", "tsu");
  68. // 注释
  69. university.addComment("这个是根节点");
  70. Element college = university.addElement("college");
  71. college.addAttribute("name", "cccccc");
  72. college.setText("text");
  73. File file = new File("src/dom4j-modify.xml");
  74. if (file.exists()) {
  75. file.delete();
  76. }
  77. file.createNewFile();
  78. XMLWriter out = new XMLWriter(new FileWriter(file));
  79. out.write(doc);
  80. out.flush();
  81. out.close();
  82. } catch (IOException e) {
  83. e.printStackTrace();
  84. }
  85. }
  86. }
  87. class MyVistor extends VisitorSupport {
  88. public void visit(Attribute node) {
  89. System.out.println("Attibute: " + node.getName() + "="
  90. + node.getValue());
  91. }
  92. public void visit(Element node) {
  93. if (node.isTextOnly()) {
  94. System.out.println("Element: " + node.getName() + "="
  95. + node.getText());
  96. } else {
  97. System.out.println(node.getName());
  98. }
  99. }
  100. @Override
  101. public void visit(ProcessingInstruction node) {
  102. System.out.println("PI:" + node.getTarget() + " " + node.getText());
  103. }
  104. }

三、【性能测试】

环境:AMD4400+ 2.0+GHz主频 JDK6.0
运行参数:-Xms400m -Xmx400m
xml文件大小:10.7M
结果:
DOM: >581297ms
SAX: 8829ms
JDOM: 581297ms
DOM4j: 5309ms
时间包括IO的,只是进行了简单的测试, 仅供参考!!!!

四、【对比】

1、【DOM】
DOM是基于树的结构,通常需要加载整文档和构造DOM树,然后才能开始工作。
优点:
  a、由于整棵树在内存中,因此可以对xml文档随机访问
  b、可以对xml文档进行修改操作
  c、较sax,dom使用也更简单。
缺点:
  a、整个文档必须一次性解析完
  a、由于整个文档都需要载入内存,对于大文档成本高
2、【SAX】
SAX类似流媒体,它基于事件驱动的,因此无需将整个文档载入内存,使用者只需要监听自己感兴趣的事件即可。
优点:
  a、无需将整个xml文档载入内存,因此消耗内存少
  b、可以注册多个ContentHandler
缺点:
  a、不能随机的访问xml中的节点
  b、不能修改文档
3、【JDOM】
JDOM是纯Java的处理XML的API,其API中大量使用Collections类,
优点:
  a、DOM方式的优点
  b、具有SAX的Java规则
缺点
  a、DOM方式的缺点
4、【DOM4J】
这4中xml解析方式中,最优秀的一个,集易用和性能于一身。

五、【小插曲XPath】

XPath 是一门在 XML 文档中查找信息的语言, 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此,对 XPath 的理解是很多高级 XML 应用的基础。
XPath非常类似对数据库操作的SQL语言,或者说JQuery,它可以方便开发者抓起文档中需要的东西。(dom4j也支持xpath)
示例代码:
  1. package test.xml;
  2. import java.io.IOException;
  3. import java.io.InputStream;
  4. import javax.xml.parsers.DocumentBuilder;
  5. import javax.xml.parsers.DocumentBuilderFactory;
  6. import javax.xml.parsers.ParserConfigurationException;
  7. import javax.xml.xpath.XPath;
  8. import javax.xml.xpath.XPathConstants;
  9. import javax.xml.xpath.XPathExpression;
  10. import javax.xml.xpath.XPathExpressionException;
  11. import javax.xml.xpath.XPathFactory;
  12. import org.w3c.dom.Document;
  13. import org.w3c.dom.NodeList;
  14. import org.xml.sax.SAXException;
  15. public class TestXPath {
  16. public static void main(String[] args) {
  17. read();
  18. }
  19. public static void read() {
  20. try {
  21. DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
  22. DocumentBuilder builder = dbf.newDocumentBuilder();
  23. InputStream in = TestXPath.class.getClassLoader().getResourceAsStream("test.xml");
  24. Document doc = builder.parse(in);
  25. XPathFactory factory = XPathFactory.newInstance();
  26. XPath xpath = factory.newXPath();
  27. // 选取所有class元素的name属性
  28. // XPath语法介绍: http://w3school.com.cn/xpath/
  29. XPathExpression expr = xpath.compile("//class/@name");
  30. NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
  31. for (int i = 0; i < nodes.getLength(); i++) {
  32. System.out.println("name = " + nodes.item(i).getNodeValue());
  33. }
  34. } catch (XPathExpressionException e) {
  35. e.printStackTrace();
  36. } catch (ParserConfigurationException e) {
  37. e.printStackTrace();
  38. } catch (SAXException e) {
  39. e.printStackTrace();
  40. } catch (IOException e) {
  41. e.printStackTrace();
  42. }
  43. }
  44. }

六、【补充】

注意4种解析方法对TextNode(文本节点)的处理:

1、在使用DOM时,调用node.getChildNodes()获取该节点的子节点,文本节点也会被当作一个Node来返回,如:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <university name="pku">
  3. <college name="c1">
  4. <class name="class1">
  5. <student name="stu1" sex='male' age="21" />
  6. <student name="stu2" sex='female' age="20" />
  7. <student name="stu3" sex='female' age="20" />
  8. </class>
  9. </college>
  10. </university>
  1. package test.xml;
  2. import java.io.FileNotFoundException;
  3. import java.io.IOException;
  4. import java.io.InputStream;
  5. import java.util.Arrays;
  6. import javax.xml.parsers.DocumentBuilder;
  7. import javax.xml.parsers.DocumentBuilderFactory;
  8. import javax.xml.parsers.ParserConfigurationException;
  9. import org.w3c.dom.Document;
  10. import org.w3c.dom.Element;
  11. import org.w3c.dom.Node;
  12. import org.w3c.dom.NodeList;
  13. import org.xml.sax.SAXException;
  14. public class TestDom2 {
  15. public static void main(String[] args) {
  16. read();
  17. }
  18. public static void read() {
  19. DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
  20. try {
  21. DocumentBuilder builder = dbf.newDocumentBuilder();
  22. InputStream in = TestDom2.class.getClassLoader().getResourceAsStream("test.xml");
  23. Document doc = builder.parse(in);
  24. // root <university>
  25. Element root = doc.getDocumentElement();
  26. if (root == null) return;
  27. // System.err.println(root.getAttribute("name"));
  28. // all college node
  29. NodeList collegeNodes = root.getChildNodes();
  30. if (collegeNodes == null) return;
  31. System.err.println("university子节点数:" + collegeNodes.getLength());
  32. System.err.println("子节点如下:");
  33. for(int i = 0; i < collegeNodes.getLength(); i++) {
  34. Node college = collegeNodes.item(i);
  35. if (college == null) continue;
  36. if (college.getNodeType() == Node.ELEMENT_NODE) {
  37. System.err.println("\t元素节点:" + college.getNodeName());
  38. } else if (college.getNodeType() == Node.TEXT_NODE) {
  39. System.err.println("\t文本节点:" + Arrays.toString(college.getTextContent().getBytes()));
  40. }
  41. }
  42. } catch (ParserConfigurationException e) {
  43. e.printStackTrace();
  44. } catch (FileNotFoundException e) {
  45. e.printStackTrace();
  46. } catch (SAXException e) {
  47. e.printStackTrace();
  48. } catch (IOException e) {
  49. e.printStackTrace();
  50. }
  51. }
  52. }
输出的结果是:
  1. university子节点数:3
  2. 子节点如下:
  3. 文本节点:[10, 9]
  4. 元素节点:college
  5. 文本节点:[10]

其中\n的ASCII码为10,\t的ASCII码为9。结果让人大吃一惊,university的子节点数不是1,也不是2,而是3,这3个子节点都是谁呢?为了看得更清楚点,把xml文档改为:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <university name="pku">11
  3. <college name="c1">
  4. <class name="class1">
  5. <student name="stu1" sex='male' age="21" />
  6. <student name="stu2" sex='female' age="20" />
  7. <student name="stu3" sex='female' age="20" />
  8. </class>
  9. </college>22
  10. </university>
还是上面的程序,输出结果为:
  1. university子节点数:3
  2. 子节点如下:
  3. 文本节点:[49, 49, 10, 9]
  4. 元素节点:college
  5. 文本节点:[50, 50, 10]
其中数字1的ASCII码为49,数字2的ASCII码为50。

2、使用SAX来解析同DOM,当你重写它的public void characters(char[] ch, int start, int length)方法时,你就能看到。

3、JDOM,调用node.getChildren()只返回子节点,不包括TextNode节点(不管该节点是否有Text信息)。如果要获取该节点的Text信息,可以调用node.getText()方法,该方法返回节点的Text信息,也包括\n\t等特殊字符。

4、DOM4j同JDOM

参考:

http://www.docin.com/p-78963650.html

http://wenku.baidu.com/view/b091f9360b4c2e3f5727638b.html

http://kree.iteye.com/blog/668280
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值