1 在Java中解析XML文件共有四种方式
- A、DOM方式解析XML数据
树结构,有助于更好地理解、掌握,代码易于编写,在解析过程中树结构是保存在内存中,方便修改
- B、SAX方式解析
采用事件驱动模式,对内存消耗比较小,适用于仅处理xml中的数据时使用
- C、JDOM方式解析
大量采用了 Collections 类
- D、DOM4J方式解析
JDOM的一种智能分支,合并了许多超出基本XML文档表示的功能;
性能优越,灵活性好,功能强大,极端易用。
2 要处理的XML文件
<?xml version="1.0" encoding="UTF-8"?> <books xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <book id="1001"> <name>JAVA 高级编程</name> <author>张三</author> <price>85.72</price> </book> <book id="1002"> <name>C++和C#</name> <author>李失失</author> <price>125.73</price> </book> </books>
3 DOM方式解析XML数据的步骤
a. 创建一个DocumentBuilderFactory对象
b. 创建一个DocumentBuilder对象
c. 通过DocumentBuilder的parse()方法,得到Document对象
d. 通过getElementsByTagName()方法,获取节点的列表
e. 使用for循环遍历节点
f. 得到所有节点的属性和属性值
g. 得到所有节点的节点名和节点值
import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class TestDom4Xml { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //创建一个DocumentBuilderFactory对象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); //创建一个DocumentBuilder对象 DocumentBuilder db = dbf.newDocumentBuilder(); //通过DocumentBuilder的parse()方法,得到Document对象 Document doc = db.parse("book.xml"); //通过getElementsByTagName()方法,获取节点的列表 NodeList nodelist = doc.getElementsByTagName("book"); System.out.println(nodelist.getLength()); //使用for循环遍历节点 for(int i=0;i<nodelist.getLength();i++){ Node node = nodelist.item(i); //得到所有节点属性和属性值的对象 NamedNodeMap nnm = node.getAttributes(); for(int j=0;j<nnm.getLength();j++){ Node sub_node = nnm.item(j); //得到所有节点的属性和属性值 System.out.println(sub_node.getNodeName() + " : " + sub_node.getNodeValue()); } //得到所有节点的子节点 NodeList childlist = node.getChildNodes(); for(int j=0;j<childlist.getLength();j++){ Node sub_node = childlist.item(j); //获取节点类型 short type = sub_node.getNodeType(); //判断节点类型是否不为#text,因会将前一标签的末尾>与下一标签的开头<之间的字符,标记为#text //因此这里需要进行判断 if(type == Node.ELEMENT_NODE){ //得到所有节点的节点名和节点值 System.out.println(sub_node.getNodeName() + " : " + sub_node.getTextContent()); } } } } }
输出结果如下
2
id : 1001
name : JAVA 高级编程
author : 张三
price : 85.72
id : 1002
name : C++和C#
author : 李失失
price : 125.73
4 SAX方式解析XML文件
4.1 创建DeaultHandler子类,用来解析XML文档
import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class BookDefaultHandler extends DefaultHandler { /** * 解析xml文档时调用 */ public void startDocument() throws SAXException { System.out.println("开始解析XML文档"); super.startDocument(); } /** * 解析xml文档结束时调用 */ public void endDocument() throws SAXException { super.endDocument(); System.out.println("完成解析XML文档"); } /** * 解析XML文档节点开始时使用 */ public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { super.startElement(uri, localName, qName, attributes); //判断如果是 book节点,获取节点属性和属性值 if(qName.equals("book")){ //获取当前属性的数量 int len = attributes.getLength(); //循环获取每个属性 for(int i=0;i<len;i++){ //属性名称 String name = attributes.getQName(i); //属性值 String value = attributes.getValue(i); System.out.println("属性名称: " + name + "\t属性值: " + value); } }else if(!"books".equals(qName) && !"book".equals(qName)){ System.out.print("节点的名称:" + qName + "\t"); } } /** * 解析XML文档节点结束时使用 */ public void endElement(String uri, String localName, String qName) throws SAXException { super.endElement(uri, localName, qName); } /** * 解析节点文本内容 */ public void characters(char[] ch, int start, int length) throws SAXException { super.characters(ch, start, length); //将节点文本转为字符串 String value = new String(ch, start, length); //排除空数据,并输出节点文本 if(!"".equals(value.trim())){ System.out.println(value); } } }
4.2 SAX方式解析XML数据的步骤
a. 创建SAXParserFactory对象
b. 创建SAXParser对象(作为解析器)
c. 创建DefaultHandler子类对象
d. 调用parse方法
import java.io.IOException; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.SAXException; public class TestSax4Xml { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //a. 创建SAXParserFactory对象 SAXParserFactory spf = SAXParserFactory.newInstance(); //b. 创建SAXParser对象(作为解析器) SAXParser sp = spf.newSAXParser(); //c. 创建DefaultHandler子类对象 BookDefaultHandler bdh = new BookDefaultHandler(); //d. 调用SAXParser对象的parse方法 sp.parse("book.xml", bdh); } }
4.3 输出结果
开始解析XML文档
属性名称: id 属性值: 1001
节点的名称:name JAVA 高级编程
节点的名称:author 张三
节点的名称:price 85.72
属性名称: id 属性值: 1002
节点的名称:name C++和C#
节点的名称:author 李失失
节点的名称:price 125.73
完成解析XML文档
5 JDOM方式解析XML数据
5.1 步骤
a. 创建SAXBuilder对象
b. 调用build方法,通过IO流得到Document对象
c. 获取根节点
d. 获取根节点下直接子节点的集合
e. 遍历集合
import java.io.FileInputStream; import java.io.IOException; import java.util.List; import org.jdom2.Attribute; import org.jdom2.Document; import org.jdom2.Element; import org.jdom2.JDOMException; import org.jdom2.input.SAXBuilder; public class TestJdom4Xml { public static void main(String[] args) throws JDOMException, IOException { //a. 创建SAXBuilder对象 SAXBuilder sb = new SAXBuilder(); //b. 调用build方法,通过OI流得到Document对象 Document doc = sb.build(new FileInputStream("src/book.xml")); //c. 获取根节点 Element root = doc.getRootElement(); //d. 获取根节点下直接子节点的集合 List<Element> books = root.getChildren(); //e. 遍历集合,获取每一个子节点 for(int i=0;i<books.size();i++){ //获取集合中的元素 Element book = books.get(i); //获取当前节点下的属性集合 List<Attribute> atts = book.getAttributes(); for(int j=0;j<atts.size();j++){ //输出属性名称:属性值 System.out.println(atts.get(j).getName() + "\t" + atts.get(j).getValue()); } //获取当前节点下子节点 List<Element> subEles = book.getChildren(); //遍历子节点,获取名称和文本值 for(Element e : subEles){ System.out.println(e.getName() + "\t" + e.getValue()); } } } }
5.2 输出结果
id 1001
name JAVA 高级编程
author 张三
price 85.72
id 1002
name C++和C#
author 李失失
price 125.73
6 DOM4J解析XML
6.1 DOM4J解析XML步骤
a. 创建SAXReader对象
b. 调用read方法
c. 获取根节点
d. 通过迭代器遍历直接节点
import java.io.FileInputStream; import java.io.FileNotFoundException; import java.util.Iterator; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class TestDom4jXml { public static void main(String[] args) throws FileNotFoundException, DocumentException { //a. 创建SAXReader对象 SAXReader sr = new SAXReader(); //b. 调用read方法 Document doc = sr.read(new FileInputStream("src/book.xml")); //c. 获取根节点 Element root = doc.getRootElement(); //d. 通过迭代器遍历直接节点 for(Iterator<Element> iter=root.elementIterator();iter.hasNext();){ Element book = iter.next(); //获取节点下所有属性 Iterator<Attribute> arrts = book.attributeIterator(); //遍历属性信息 while(arrts.hasNext()){ Attribute at = arrts.next(); String name = at.getName(); String value = at.getValue(); System.out.println("节点属性:" + name + "\t" + value); } //遍历节点下子节点 Iterator<Element> subele = book.elementIterator(); //获取子节点下所有节点名称和文本值 while(subele.hasNext()){ Element node = subele.next(); System.out.println(node.getName() + "\t" + node.getText()); } } } }
6.2 输出结果
节点属性:id 1001
name JAVA 高级编程
author 张三
price 85.72
节点属性:id 1002
name C++和C#
author 李失失
price 125.73