java dom xpath_JAVA与DOM解析器提高（DOM/SAX/JDOM/DOM4j/XPath）学习笔记二-CSDN博客

本文链接：https://blog.csdn.net/weixin_39704374/article/details/114069123

这篇博客详细介绍了Java中XML解析的几种主要方式，包括DOM、SAX、JDOM和DOM4J。DOM解析会将整个XML文档加载到内存，适合小规模数据；SAX基于事件驱动，节省内存，适用于大文件；JDOM提供更简单的API，而DOM4J在功能和性能上更优秀，支持XPath。此外，还展示了如何使用这些方法读写XML文件以及处理XML文档的属性和节点。

摘要由CSDN通过智能技术生成

要求

必备知识

JAVA基础知识。XML基础知识。

开发环境

MyEclipse10

资料下载

sax、dom是两种对xml文档进行解析的方法(没有具体实现，只是接口)，所以只有它们是无法解析xml文档的；jaxp只是api，它进一步封装了sax、dom两种接口，并且提供了DomcumentBuilderFactory/DomcumentBuilder和SAXParserFactory/SAXParser(默认使用xerces解释器)。

如对DOM解析器还有疑问,请查看这里。目前在Java中用于解析XML的技术很多，主流的有DOM、SAX、JDOM、DOM4j,下面分别介绍这四种方式如何操作DOM。

university.xml

dom读写xml 输出属性值,此方法我已经到上篇随笔中有详细介绍了,点这里查看.

TestDom.java

importjava.io.File;importjava.io.FileNotFoundException;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parsers.DocumentBuilderFactory;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.transform.Transformer;importjavax.xml.transform.TransformerConfigurationException;importjavax.xml.transform.TransformerException;importjavax.xml.transform.TransformerFactory;importjavax.xml.transform.dom.DOMSource;importjavax.xml.transform.stream.StreamResult;importorg.w3c.dom.Document;importorg.w3c.dom.Element;importorg.w3c.dom.Node;importorg.w3c.dom.NodeList;importorg.w3c.dom.Text;importorg.xml.sax.SAXException;/*** dom读写xml 输出属性值

*@authorwhwang*/

public classTestDom {public static voidread() {

DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();try{

DocumentBuilder builder=dbf.newDocumentBuilder();

InputStream in= TestDom.class.getClassLoader().getResourceAsStream("university.xml"); //读取src目录下文件

Document doc =builder.parse(in);

Element root= doc.getDocumentElement(); //获取根元素

if (root == null) return;

System.err.println(root.getAttribute("name")); //获取根元素的name属性值

NodeList collegeNodes= root.getChildNodes();//根元素下的所有子元素

if (collegeNodes == null) return;/*** 循环所有的根元素下的所有只节点

* 根元素下所有的college 节点*/

for(int i = 0; i < collegeNodes.getLength(); i++) {

Node college=collegeNodes.item(i);if (college != null && college.getNodeType() ==Node.ELEMENT_NODE) {

System.err.println("\t" + college.getAttributes().getNamedItem("name").getNodeValue()); //获取节点 name属性值//所有的class节点

NodeList classNodes =college.getChildNodes();if (classNodes == null) continue;for (int j = 0; j < classNodes.getLength(); j++) {

Node clazz=classNodes.item(j);if (clazz != null && clazz.getNodeType() ==Node.ELEMENT_NODE) {

System.err.println("\t\t" + clazz.getAttributes().getNamedItem("name").getNodeValue());//所有的student节点

NodeList studentNodes =clazz.getChildNodes();if (studentNodes == null) continue;for (int k = 0; k < studentNodes.getLength(); k++) {

Node student=studentNodes.item(k);if (student != null && student.getNodeType() ==Node.ELEMENT_NODE) {

System.err.print("\t\t\t" + student.getAttributes().getNamedItem("name").getNodeValue());

System.err.print(" " + student.getAttributes().getNamedItem("sex").getNodeValue());

System.err.println(" " + student.getAttributes().getNamedItem("age").getNodeValue());

}

}catch(ParserConfigurationException e) {

e.printStackTrace();

}catch(FileNotFoundException e) {

e.printStackTrace();

}catch(SAXException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}

}/*** 读取本地XML文件修改后另存为*/

public static voidwrite() {

DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();try{

DocumentBuilder builder=dbf.newDocumentBuilder();

InputStream in= TestDom.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=builder.parse(in);//根节点

Element root =doc.getDocumentElement();if (root == null) return;//修改属性

root.setAttribute("name", "tsu"); //给根元素添加 name属性和属性值

NodeList collegeNodes =root.getChildNodes();if (collegeNodes != null) {for (int i = 0; i

Node college =collegeNodes.item(i);if (college.getNodeType() ==Node.ELEMENT_NODE) {

String collegeName= college.getAttributes().getNamedItem("name").getNodeValue();if ("c1".equals(collegeName) || "c2".equals(collegeName)) {

root.removeChild(college);

}else if ("c3".equals(collegeName)) {

Element newChild= doc.createElement("class");

newChild.setAttribute("name", "c4");

college.appendChild(newChild);

}

}//新增节点

Element addCollege = doc.createElement("college");

addCollege.setAttribute("name", "c5");

root.appendChild(addCollege);

Text text= doc.createTextNode("text");

addCollege.appendChild(text);//将修改后的文档保存到文件

TransformerFactory transFactory =TransformerFactory.newInstance();

Transformer transFormer=transFactory.newTransformer();

DOMSource domSource= newDOMSource(doc);

File file= new File("src/dom-modify.xml");if(file.exists()) {

file.delete();

}

file.createNewFile();

FileOutputStream out= newFileOutputStream(file);

StreamResult xmlResult= newStreamResult(out);

transFormer.transform(domSource, xmlResult);

System.out.println(file.getAbsolutePath());//获取文件的据对路径

} catch(ParserConfigurationException e) {

e.printStackTrace();

}catch(SAXException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}catch(TransformerConfigurationException e) {

e.printStackTrace();

}catch(TransformerException e) {

e.printStackTrace();

}

}public static voidmain(String[] args) {

read();//write();

}

SAX不用将整个文档加载到内存，基于事件驱动的API(Observer模式)，用户只需要注册自己感兴趣的事件即可。SAX提供EntityResolver, DTDHandler, ContentHandler, ErrorHandler接口，分别用于监听解析实体事件、DTD处理事件、正文处理事件和处理出错事件，与AWT类似，SAX还提供了一个对这4个接口默认的类DefaultHandler(这里的默认实现，其实就是一个空方法)，一般只要继承DefaultHandler.

TestSAX.java

importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.parsers.SAXParser;importjavax.xml.parsers.SAXParserFactory;importorg.xml.sax.Attributes;importorg.xml.sax.InputSource;importorg.xml.sax.Locator;importorg.xml.sax.SAXException;importorg.xml.sax.SAXParseException;importorg.xml.sax.helpers.DefaultHandler;/***

*@authorwhwang*/

public classTestSAX {public static voidmain(String[] args) {

read();

write();

}public static voidread() {try{

SAXParserFactory factory=SAXParserFactory.newInstance();

SAXParser parser=factory.newSAXParser();

InputStream in= TestSAX.class.getClassLoader().getResourceAsStream("university.xml");

parser.parse(in,newMyHandler());

}catch(ParserConfigurationException e) {

e.printStackTrace();

}catch(SAXException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}

}public static voidwrite() {

System.err.println("纯SAX对于写操作无能为力");

}

}//重写对自己感兴趣的事件处理方法

class MyHandler extendsDefaultHandler {

@OverridepublicInputSource resolveEntity(String publicId, String systemId)throwsIOException, SAXException {return super.resolveEntity(publicId, systemId);

}

@Overridepublic voidnotationDecl(String name, String publicId, String systemId)throwsSAXException {super.notationDecl(name, publicId, systemId);

}

@Overridepublic voidunparsedEntityDecl(String name, String publicId,

String systemId, String notationName)throwsSAXException {super.unparsedEntityDecl(name, publicId, systemId, notationName);

}

@Overridepublic voidsetDocumentLocator(Locator locator) {super.setDocumentLocator(locator);

}

@Overridepublic void startDocument() throwsSAXException {

System.err.println("开始解析文档");

}

@Overridepublic void endDocument() throwsSAXException {

System.err.println("解析结束");

}

@Overridepublic voidstartPrefixMapping(String prefix, String uri)throwsSAXException {super.startPrefixMapping(prefix, uri);

}

@Overridepublic void endPrefixMapping(String prefix) throwsSAXException {super.endPrefixMapping(prefix);

}

@Overridepublic voidstartElement(String uri, String localName, String qName,

Attributes attributes)throwsSAXException {

System.err.print("Element: " + qName + ", attr: ");

print(attributes);

}

@Overridepublic voidendElement(String uri, String localName, String qName)throwsSAXException {super.endElement(uri, localName, qName);

}

@Overridepublic void characters(char[] ch, int start, intlength)throwsSAXException {super.characters(ch, start, length);

}

@Overridepublic void ignorableWhitespace(char[] ch, int start, intlength)throwsSAXException {super.ignorableWhitespace(ch, start, length);

}

@Overridepublic voidprocessingInstruction(String target, String data)throwsSAXException {super.processingInstruction(target, data);

}

@Overridepublic void skippedEntity(String name) throwsSAXException {super.skippedEntity(name);

}

@Overridepublic void warning(SAXParseException e) throwsSAXException {super.warning(e);

}

@Overridepublic void error(SAXParseException e) throwsSAXException {super.error(e);

}

@Overridepublic void fatalError(SAXParseException e) throwsSAXException {super.fatalError(e);

}private voidprint(Attributes attrs) {if (attrs == null) return;

System.err.print("[");for (int i = 0; i < attrs.getLength(); i++) {

System.err.print(attrs.getQName(i)+ " = " +attrs.getValue(i));if (i != attrs.getLength() - 1) {

System.err.print(", ");

}

System.err.println("]");

}

JDOM与DOM非常类似，它是处理XML的纯JAVA API，API大量使用了Collections类，且JDOM仅使用具体类而不使用接口。　JDOM 它自身不包含解析器。它通常使用 SAX2 解析器来解析和验证输入 XML 文档(尽管它还可以将以前构造的 DOM 表示作为输入)。它包含一些转换器以将 JDOM 表示输出成 SAX2 事件流、DOM 模型或 XML 文本文档。

TestJDom.java

importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.util.List;importorg.jdom.Attribute;importorg.jdom.Document;importorg.jdom.Element;importorg.jdom.JDOMException;importorg.jdom.input.SAXBuilder;importorg.jdom.output.XMLOutputter;/*** JDom读写xml

*@authorwhwang*/

public classTestJDom {public static voidmain(String[] args) {

read();

write();

}public static voidread() {try{boolean validate = false;

SAXBuilder builder= newSAXBuilder(validate);

InputStream in= TestJDom.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=builder.build(in);//获取根节点

Element root =doc.getRootElement();

readNode(root,"");

}catch(JDOMException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}

@SuppressWarnings("unchecked")public static voidreadNode(Element root, String prefix) {if (root == null) return;//获取属性

List attrs =root.getAttributes();if (attrs != null && attrs.size() > 0) {

System.err.print(prefix);for(Attribute attr : attrs) {

System.err.print(attr.getValue()+ " ");

}

System.err.println();

}//获取他的子节点

List childNodes =root.getChildren();

prefix+= "\t";for(Element e : childNodes) {

readNode(e, prefix);

}

}public static voidwrite() {boolean validate = false;try{

SAXBuilder builder= newSAXBuilder(validate);

InputStream in= TestJDom.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=builder.build(in);//获取根节点

Element root =doc.getRootElement();//修改属性

root.setAttribute("name", "tsu");//删除

boolean isRemoved = root.removeChildren("college");

System.err.println(isRemoved);//新增

Element newCollege = new Element("college");

newCollege.setAttribute("name", "new_college");

Element newClass= new Element("class");

newClass.setAttribute("name", "ccccc");

newCollege.addContent(newClass);

root.addContent(newCollege);

XMLOutputter out= newXMLOutputter();

File file= new File("src/jdom-modify.xml");if(file.exists()) {

file.delete();

}

file.createNewFile();

FileOutputStream fos= newFileOutputStream(file);

out.output(doc, fos);

}catch(JDOMException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}

dom4j是目前在xml解析方面是最优秀的(Hibernate、Sun的JAXM也都使用dom4j来解析XML)，它合并了许多超出基本 XML 文档表示的功能，包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理

TestDom4j.java

importjava.io.File;importjava.io.FileWriter;importjava.io.IOException;importjava.io.InputStream;importjava.util.List;importorg.dom4j.Attribute;importorg.dom4j.Document;importorg.dom4j.DocumentException;importorg.dom4j.DocumentHelper;importorg.dom4j.Element;importorg.dom4j.ProcessingInstruction;importorg.dom4j.VisitorSupport;importorg.dom4j.io.SAXReader;importorg.dom4j.io.XMLWriter;/*** Dom4j读写xml

*@authorwhwang*/

public classTestDom4j {public static voidmain(String[] args) {

read1();//read2();

write();

}public static voidread1() {try{

SAXReader reader= newSAXReader();

InputStream in= TestDom4j.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=reader.read(in);

Element root=doc.getRootElement();

readNode(root,"");

}catch(DocumentException e) {

e.printStackTrace();

}

@SuppressWarnings("unchecked")public static voidreadNode(Element root, String prefix) {if (root == null) return;//获取节点的属性

List attrs =root.attributes();if (attrs != null && attrs.size() > 0) {

System.err.print(prefix);for(Attribute attr : attrs) {

System.err.print(attr.getValue()+ " ");

}

System.err.println();

}//获取他的子节点

List childNodes =root.elements();

prefix+= "\t";for(Element e : childNodes) {

readNode(e, prefix);

}

}public static voidread2() {try{

SAXReader reader= newSAXReader();

InputStream in= TestDom4j.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=reader.read(in);

doc.accept(newMyVistor());

}catch(DocumentException e) {

e.printStackTrace();

}

}/*** 写入方法*/

public static voidwrite() {try{//创建一个xml文档

Document doc =DocumentHelper.createDocument();

Element university= doc.addElement("university");

university.addAttribute("name", "tsu");//注释

university.addComment("这个是根节点");

Element college= university.addElement("college");

college.addAttribute("name", "cccccc");

college.setText("text");

File file= new File("src/dom4j-modify.xml");if(file.exists()) {

file.delete();

}

file.createNewFile();

XMLWriter out= new XMLWriter(newFileWriter(file));

out.write(doc);

out.flush();

out.close();

}catch(IOException e) {

e.printStackTrace();

}

}class MyVistor extendsVisitorSupport {public voidvisit(Attribute node) {

System.out.println("Attibute: " + node.getName() + "="

+node.getValue());

}public voidvisit(Element node) {if(node.isTextOnly()) {

System.out.println("Element: " + node.getName() + "="

+node.getText());

}else{

System.out.println(node.getName());

}

@Overridepublic voidvisit(ProcessingInstruction node) {

System.out.println("PI:" + node.getTarget() + " " +node.getText());

}

由于DOM4J比较重要我到网上还整理了一些代码:

Dom4j.java

importjava.io.File;importjava.io.FileOutputStream;importjava.io.FileWriter;importjava.io.IOException;importjava.io.OutputStream;importjava.io.OutputStreamWriter;importjava.io.UnsupportedEncodingException;importjava.net.URL;importjava.util.Iterator;importjava.util.List;importorg.dom4j.Attribute;importorg.dom4j.Document;importorg.dom4j.DocumentHelper;importorg.dom4j.Element;importorg.dom4j.Node;importorg.dom4j.io.OutputFormat;importorg.dom4j.io.SAXReader;importorg.dom4j.io.XMLWriter;public classDom4j {/*** 获取Document对象

* 此方法文件位于项目根目录不是src目录

*@paramfilename 项目根目录下的XML文件

*@returndocument

**/

public staticDocument load(String filename) {

Document document= null;try{

SAXReader saxReader= newSAXReader();

document= saxReader.read(new File(filename)); //读取XML文件,获得document对象

} catch(Exception ex) {

ex.printStackTrace();

}returndocument;

}/*** 通过url路径获取 Document对象

* 此方式 xml文件位于远程服务器上

*@paramurl 远程url文件

*@returndocument对象*/

public staticDocument load2(URL url) {

Document document= null;try{

SAXReader saxReader= newSAXReader();

document= saxReader.read(url); //读取XML文件,获得document对象

} catch(Exception ex) {

ex.printStackTrace();

}returndocument;

}/*** 获取根节点

*@paramdoc document对象

*@return根元素*/

public staticElement getRootElement(Document doc){

Element root=null;

root=doc.getRootElement(); //获取根节点

returnroot;

}/*** 将document树输出到指定的文件

*@paramdocument document对象

*@paramfilename 文件名

*@return布尔值*/

public static booleandoc2XmlFile(Document document, String filename) {boolean flag = true;try{

XMLWriter writer= new XMLWriter( new OutputStreamWriter(new FileOutputStream(filename),"UTF-8"));

writer.write(document);

writer.close();

}catch(Exception ex) {

flag= false;

ex.printStackTrace();

}

System.out.println(flag);returnflag;

}/***

* 此方法在本类中无用，没有整合有兴趣的可以自己动手整合一下

* Dom4j通过XMLWriter将Document对象表示的XML树写入指定的文件，

* 并使用OutputFormat格式对象指定写入的风格和编码方法。

* 调用OutputFormat.createPrettyPrint()方法可以获得一个默认的pretty print风格的格式对象。

* 对OutputFormat对象调用setEncoding()方法可以指定XML文件的编码方法。

*@paramdoc

*@paramout

*@paramencoding

*@throwsUnsupportedEncodingException

*@throwsIOException*/

/*public void writeTo(Document doc,OutputStream out, String encoding) throws UnsupportedEncodingException, IOException {

OutputFormat format = OutputFormat.createPrettyPrint();

format.setEncoding("gb2312");

XMLWriter writer = new XMLWriter(System.out,format);

writer.write(doc);

writer.flush();

}*/

/*** 遍历根标记下的子元素

*@paramargs*/

public static voidread(Element root){for(Iterator i=root.elementIterator();i.hasNext();){

Element element=(Element)i.next();

System.out.print(element.getName()+":"+element.getText());if(element.getNodeType()==Node.ELEMENT_NODE){

read(element);

}

}/*** 写入操作

*@paramfileName*/

public static voidwrite(String fileName){

Document document=DocumentHelper.createDocument();//建立document对象，用来操作xml文件

Element booksElement=document.addElement("books");//建立根节点

booksElement.addComment("This is a test for dom4j ");//加入一行注释

Element bookElement=booksElement.addElement("book");//添加一个book节点

bookElement.addAttribute("show","yes");//添加属性内容

Element titleElement=bookElement.addElement("title");//添加文本节点

titleElement.setText("ajax in action");//添加文本内容

try{

XMLWriter writer=new XMLWriter(new FileWriter(newFile(fileName)));

writer.write(document);

writer.close();

}catch(Exception e){

e.printStackTrace();

}

}/*** 修改XML文件*/

public static voidmodifyXMLFile() {

String oldStr= "test.xml";

String newStr= "test1.xml";

Document document= null;//修改节点的属性

try{

SAXReader saxReader= new SAXReader(); //用来读取xml文档

document = saxReader.read(new File(oldStr)); //读取xml文档

List list = document.selectNodes("/books/book/@show");//用xpath查找节点book的属性

Iterator iter =list.iterator();while(iter.hasNext()) {

Attribute attribute=(Attribute) iter.next();if (attribute.getValue().equals("yes"))

attribute.setValue("no");

}

}catch(Exception e) {

e.printStackTrace();

}//修改节点的内容

try{

SAXReader saxReader= new SAXReader(); //用来读取xml文档

document = saxReader.read(new File(oldStr)); //读取xml文档

List list = document.selectNodes("/books/book/title");//用xpath查找节点book的内容

Iterator iter =list.iterator();while(iter.hasNext()) {

Element element=(Element) iter.next();

element.setText("xxx");//设置相应的内容

}

}catch(Exception e) {

e.printStackTrace();

}try{

XMLWriter writer= new XMLWriter(new FileWriter(newFile(newStr)));

writer.write(document);

writer.close();

}catch(Exception ex) {

ex.printStackTrace();

}

}public static voidmain(String[] args){

Document doc=load("student.xml");

Element root=getRootElement(doc);

read(root);

write("test.xml");

modifyXMLFile();

}

XPath 是一门在 XML 文档中查找信息的语言，可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此，对 XPath 的理解是很多高级 XML 应用的基础。

XPath非常类似对数据库操作的SQL语言，或者说JQuery，它可以方便开发者抓起文档中需要的东西。(dom4j也支持xpath, dom4j使用xpath请点击这里)

TestXPath.java

importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parsers.DocumentBuilderFactory;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.xpath.XPath;importjavax.xml.xpath.XPathConstants;importjavax.xml.xpath.XPathExpression;importjavax.xml.xpath.XPathExpressionException;importjavax.xml.xpath.XPathFactory;importorg.w3c.dom.Document;importorg.w3c.dom.NodeList;importorg.xml.sax.SAXException;/***

* 普通DOM与XPath

*@authorlicheng

**/

public classTestXPath {public static voidmain(String[] args) {

read();

}public static voidread() {try{

DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();

DocumentBuilder builder=dbf.newDocumentBuilder();

InputStream in= TestXPath.class.getClassLoader().getResourceAsStream("university.xml");

Document doc=builder.parse(in);

XPathFactory factory=XPathFactory.newInstance();

XPath xpath=factory.newXPath();//选取所有class元素的name属性//XPath语法介绍：http://w3school.com.cn/xpath/