本文主要介绍4种主流的Java解析xml文件的方式,仅供参考,本文待解析的books.xml文件内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book id="1">
<name>冰与火之歌</name>
<author>乔治马丁</author>
<price>88</price>
</book>
<book id="2">
<name>安徒生童话</name>
<author>安徒生</author>
<year>2004</year>
</book>
</bookstore>
1.sax解析xml
1.1 SAXParserHandler.java
package com.demo.xml;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParserHandler extends DefaultHandler {
/*
* 解析开始
*/
@Override
public void startDocument() throws SAXException {
// TODO Auto-generated method stub
super.startDocument();
System.out.println("解析开始");
}
/*
* (non-Javadoc)
* @see org.xml.sax.helpers.DefaultHandler#endDocument()
* 用来标志解析结束
*/
@Override
public void endDocument() throws SAXException {
// TODO Auto-generated method stub
super.endDocument();
System.out.println("解析结束");
}
/**
* 遍历标签开始
*/
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
// TODO Auto-generated method stub
super.startElement(uri, localName, qName, attributes);
if(qName.equals("book")){
//前提,知道book属性名是id
String value = attributes.getValue("id");
System.out.println("book下面id属性的值:"+value);
//不知道
int num = attributes.getLength();
System.out.println("book属性个数:"+num);
//循环遍历book下面的属性
for (int i = 0; i < num; i++) {
System.out.println("book节点下的属性名:"+attributes.getQName(i)+"===对应属性值:"+attributes.getValue(i));
}
}else if(!qName.equals("book") && !qName.equals("bookstore")){
System.out.print("book节点下子节点属性名:"+qName+"===");
}
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
// TODO Auto-generated method stub
super.endElement(uri, localName, qName);
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
// TODO Auto-generated method stub
super.characters(ch, start, length);
String str = new String(ch,start,length);
if(!str.trim().equals("")){
System.out.println("对应的节点值:"+str);
}
}
}
1.2 测试类 SAXTest.java
package com.demo.xml;
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.SAXException;
public class SAXTest {
public static void main(String[] args) {
//获取一个SAXParserFactory对象
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
//获取SAXParser对象
SAXParser parse = factory.newSAXParser();
SAXParserHandler handle = new SAXParserHandler();
parse.parse("books.xml", handle);
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch ( SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
运行结果:
解析开始
book下面id属性的值:1
book属性个数:1
book节点下的属性名:id===对应属性值:1
book节点下子节点属性名:name===对应的节点值:冰与火之歌
book节点下子节点属性名:author===对应的节点值:乔治马丁
book节点下子节点属性名:price===对应的节点值:88
book下面id属性的值:2
book属性个数:1
book节点下的属性名:id===对应属性值:2
book节点下子节点属性名:name===对应的节点值:安徒生童话
book节点下子节点属性名:author===对应的节点值:安徒生
book节点下子节点属性名:year===对应的节点值:2004
解析结束
2.dom解析xml
测试类 DomTest.java
package com.demo.xml;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DomTest {
public static void main(String[] args) {
//创建一个DoucmentBuilderFactory对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
//创建一个DocumentBuilder对象
DocumentBuilder db = dbf.newDocumentBuilder();
//解析xml文件
Document document = db.parse("books.xml");
//开始解析
NodeList bookList = document.getElementsByTagName("book");
//遍历NodeList
System.out.println("book节点个数:"+bookList.getLength());
for (int i = 0; i < bookList.getLength(); i++) {
//遍历第i个节点内容
Node book = bookList.item(i);
//获取book节点下的属性
NamedNodeMap attrs = book.getAttributes();
System.out.println("第"+(i+1)+"本书节点属性个数:"+attrs.getLength());
for (int j = 0; j < attrs.getLength(); j++) {
Node attr = attrs.item(j);
System.out.println("获取第"+(i+1)+"本书的属性名:"+attr.getNodeName()+"===对应的属性值:"+attr.getNodeValue());
}
//获取book子节点
NodeList childList = book.getChildNodes();
System.out.println("获取第"+(i+1)+"本书子节点个数:"+childList.getLength());
//遍历子节点
for (int j = 0; j < childList.getLength(); j++) {
//获取每一个子节点对象
Node node = childList.item(j);
if(node.getNodeType() == Element.ELEMENT_NODE){
System.out.println("获取第"+(i+1)+"本书子节点名称:"+node.getNodeName()+"===对应的属性值:"+node.getFirstChild().getNodeValue());
//System.out.println("获取第"+(i+1)+"本书子节点名称:"+node.getNodeName()+"===对应的属性值:"+node.getTextContent());
}
}
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
}catch (SAXException e) {
e.printStackTrace();
}catch ( IOException e) {
e.printStackTrace();
}
}
}
运行结果:
book节点个数:2
第1本书节点属性个数:1
获取第1本书的属性名:id===对应的属性值:1
获取第1本书子节点个数:7
获取第1本书子节点名称:name===对应的属性值:冰与火之歌
获取第1本书子节点名称:author===对应的属性值:乔治马丁
获取第1本书子节点名称:price===对应的属性值:88
第2本书节点属性个数:1
获取第2本书的属性名:id===对应的属性值:2
获取第2本书子节点个数:7
获取第2本书子节点名称:name===对应的属性值:安徒生童话
获取第2本书子节点名称:author===对应的属性值:安徒生
获取第2本书子节点名称:year===对应的属性值:2004
3.dom4j解析xml
测试类 Dom4jTest.java
package com.demo.xml;
import java.io.File;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Dom4jTest {
public static void main(String[] args) throws DocumentException {
SAXReader reader = new SAXReader();
File file = new File("books.xml");
Document document = reader.read(file);
//获取根元素
Element root = document.getRootElement();
List<Element> childElements = root.elements();
for (Element child : childElements) {
//未知属性名情况下
List<Attribute> attributeList = child.attributes();
for (Attribute attr : attributeList) {
System.out.println(attr.getName() + ": " + attr.getValue());
}
//已知属性名情况下
//System.out.println("id: " + child.attributeValue("id"));
//未知子元素名情况下
List<Element> elementList = child.elements();
for (Element ele : elementList) {
System.out.println(ele.getName() + ": " + ele.getText());
}
System.out.println();
//已知子元素名的情况下
/* System.out.println("title" + child.elementText("names"));
System.out.println("author" + child.elementText("author"));*/
//这行是为了格式化美观而存在
System.out.println();
}
}
}
运行结果:
id: 1
name: 冰与火之歌
author: 乔治马丁
price: 88
id: 2
name: 安徒生童话
author: 安徒生
year: 2004
4.jdom解析xml
测试类 JDomTest.java
package com.iflytek.xml;
import java.io.File;
import java.io.IOException;
import java.util.List;
import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.SAXBuilder;
/**
* 利用JDom解析xml
*
* @author chendan
*
*/
public class JDomTest {
public static void main(String[] args) throws JDOMException, IOException {
// JDOM从XML中解析
SAXBuilder builder = new SAXBuilder();
// 获得XML文档对象
Document doc = builder.build(new File("books.xml"));
// 得到文档根元素
Element element = doc.getRootElement();
System.out.println("根节点:" + element.getName());
// 得到根元素下的book元素
List book = element.getChildren();
for (int i = 0; i < book.size(); i++) {
Element et = (Element) book.get(i);// 循环依次得到子元素
// 得到book元素的属性
List attrs = et.getAttributes();
// 得到book元素属性的名字和值
for (int k = 0; k < attrs.size(); k++) {
//获取book节点属性
Attribute attr = (Attribute) attrs.get(k);
String attrName = attr.getName(); //属性名
String attrValue = attr.getValue(); //属性值
System.out.println("第" + (i + 1) + "个book节点属性名:" + attrName
+ ",属性值:" + attrValue);
}
// 得到book子元素
List list = et.getChildren();
//循环得到book节点的子节点
for (int j = 0; j < list.size(); j++) {
Element el = (Element) list.get(j);
System.out.println("book子节点属性名:" + el.getName() + ",属性值:"
+ el.getValue());
}
}
}
}
运行结果:
根节点:bookstore
第1个book节点属性名:id,属性值:1
book子节点属性名:name,属性值:冰与火之歌
book子节点属性名:author,属性值:乔治马丁
book子节点属性名:price,属性值:88
第2个book节点属性名:id,属性值:2
book子节点属性名:name,属性值:安徒生童话
book子节点属性名:author,属性值:安徒生
book子节点属性名:year,属性值:2004