java解析xml字符串_java解析xml字符串方法

最新推荐文章于 2024-09-24 17:54:17 发布

Peepeepoopoo

最新推荐文章于 2024-09-24 17:54:17 发布

阅读量1.3k

点赞数

文章标签： java解析xml字符串

本文链接：https://blog.csdn.net/weixin_36409144/article/details/114036987

版权

本文介绍了XML解析的三种主要方法：DOM、SAX和DOM4J。DOM将整个XML文件加载到内存，适合小规模文档，允许随机访问和修改。SAX基于事件驱动，内存占用低，适用于大文件，但不支持随机访问。DOM4J结合了易用性和性能，被广泛应用于大型项目，如Hibernate。在选择XML解析方式时，需根据文档大小和需求灵活选择。

摘要由CSDN通过智能技术生成

一，用DOM4J 针对无重复标签的xml字符串格式，如下：

针对此种情况可用DOM4J解析法，引入 dom4j的相关jar包代码如下：

Document document=DocumentHelper.parseText(xmlStr);//xmlStr为上图格式的字符串

Node VideoCompany=document.selectSingleNode("//VideoCompany");//获取节点对象,注意引号内的“//”必须加，否则报错

Node DevIP=document.selectSingleNode("//DevIP");

//根据节点对象获取相应信息

String videoCompany=VideoCompany.getText();

String devIp=DevIP.getText();

System.out.println(devIp)//此时输出结果极为字符串：3333

二，用DOM 针对有重复标签的xml字符串格式，如下：

Harry Potter

J K. Rowling

Learning XML

Erik T. Ray

DOM 解析 XML

Java 中的 DOM 接口简介： JDK 中的 DOM API 遵循 W3C DOM 规范，其中 org.w3c.dom 包提供了 Document、DocumentType、Node、NodeList、Element 等接口，这些接口均是访问 DOM 文档所必须的。我们可以利用这些接口创建、遍历、修改 DOM 文档。

javax.xml.parsers 包中的 DoumentBuilder 和 DocumentBuilderFactory 用于解析 XML 文档生成对应的 DOM Document 对象。

javax.xml.transform.dom 和 javax.xml.transform.stream 包中 DOMSource 类和 StreamSource 类，用于将更新后的 DOM 文档写入 XML 文件。

下面给出一个运用 DOM 解析 XML 的例子：

import java.io.File;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

public class DOMParser {

DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

//Load and parse XML file into DOM

public Document parse(String filePath) {

Document document = null;

try {

//DOM parser instance

DocumentBuilder builder = builderFactory.newDocumentBuilder();

//parse an XML file into a DOM tree

document = builder.parse(new File(filePath));

} catch (ParserConfigurationException e) {

e.printStackTrace();

} catch (SAXException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

return document;

}

public static void main(String[] args) {

DOMParser parser = new DOMParser();

Document document = parser.parse("books.xml");

//get root element

Element rootElement = document.getDocumentElement();

//traverse child elements

NodeList nodes = rootElement.getChildNodes();

for (int i=0; i < nodes.getLength(); i++)

{

Node node = nodes.item(i);

if (node.getNodeType() == Node.ELEMENT_NODE) {

Element child = (Element) node;

//process child element

}

NodeList nodeList = rootElement.getElementsByTagName("book");

if(nodeList != null)

{

for (int i = 0 ; i < nodeList.getLength(); i++)

{

Element element = (Element)nodeList.item(i);

String id = element.getAttribute("id");

}

在上面的例子中，DOMParser 的 Parse() 方法负责解析 XML 文件并生成对应的 DOM Document 对象。其中 DocumentBuilderFactory 用于生成 DOM 文档解析器以便解析 XML 文档。在获取了 XML 文件对应的 Document 对象之后，我们可以调用一系列的 API 方便的对文档对象模型中的元素进行访问和处理。需要注意的是调用 Element 对象的 getChildNodes() 方法时将返回其下所有的子节点，其中包括空白节点，因此需要在处理子 Element 之前对节点类型加以判断。

可以看出 DOM 解析 XML 易于开发，只需要通过解析器建立起 XML 对应的 DOM 树型结构后便可以方便的使用 API 对节点进行访问和处理，支持节点的删除和修改等。但是 DOM 解析 XML 文件时会将整个 XML 文件的内容解析成树型结构存放在内存中，因此不适合用 DOM 解析很大的 XML 文件。

三.SAX 解析例二中XML

与 DOM 建立树形结构的方式不同，SAX 采用事件模型来解析 XML 文档，是解析 XML 文档的一种更快速、更轻量的方法。利用 SAX 可以对 XML 文档进行有选择的解析和访问，而不必像 DOM 那样加载整个文档，因此它对内存的要求较低。但 SAX 对 XML 文档的解析为一次性读取，不创建任何文档对象，很难同时访问文档中的多处数据。

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.XMLReader;

import org.xml.sax.helpers.DefaultHandler;

import org.xml.sax.helpers.XMLReaderFactory;

public class SAXParser {

class BookHandler extends DefaultHandler {

private List nameList;

private boolean title = false;

public List getNameList() {

return nameList;

}

// Called at start of an XML document

@Override

public void startDocument() throws SAXException {

System.out.println("Start parsing document...");

nameList = new ArrayList();

}

// Called at end of an XML document

@Override

public void endDocument() throws SAXException {

System.out.println("End");

}

/**

* Start processing of an element.

* @param namespaceURI Namespace URI

* @param localName The local name, without prefix

* @param qName The qualified name, with prefix

* @param atts The attributes of the element

@Override

public void startElement(String uri, String localName, String qName,

Attributes atts) throws SAXException {

// Using qualified name because we are not using xmlns prefixes here.

if (qName.equals("title")) {

title = true;

}

@Override

public void endElement(String namespaceURI, String localName, String qName)

throws SAXException {

// End of processing current element

if (title) {

title = false;

}

@Override

public void characters(char[] ch, int start, int length) {

// Processing character data inside an element

if (title) {

String bookTitle = new String(ch, start, length);

System.out.println("Book title: " + bookTitle);

nameList.add(bookTitle);

}

public static void main(String[] args) throws SAXException, IOException {

XMLReader parser = XMLReaderFactory.createXMLReader();

BookHandler bookHandler = (new SAXParser()).new BookHandler();

parser.setContentHandler(bookHandler);

parser.parse("books.xml");

System.out.println(bookHandler.getNameList());

}

SAX 解析器接口和事件处理器接口定义在 org.xml.sax 包中。主要的接口包括 ContentHandler、DTDHandler、EntityResolver 及 ErrorHandler。其中 ContentHandler 是主要的处理器接口，用于处理基本的文档解析事件；DTDHandler 和 EntityResolver 接口用于处理与 DTD 验证和实体解析相关的事件； ErrorHandler 是基本的错误处理接口。DefaultHandler 类实现了上述四个事件处理接口。上面的例子中 BookHandler 继承了 DefaultHandler 类，并覆盖了其中的五个回调方法 startDocument()、endDocument()、startElement()、endElement() 及 characters() 以加入自己的事件处理逻辑

四、XML解析总结

1、【DOM】

DOM是基于树的结构，通常需要加载整文档和构造DOM树，然后才能开始工作。

优点：

a、由于整棵树在内存中，因此可以对xml文档随机访问

b、可以对xml文档进行修改操作

c、较sax，dom使用也更简单。

缺点：

a、整个文档必须一次性解析完

a、由于整个文档都需要载入内存，对于大文档成本高

2、【SAX】

SAX类似流媒体，它基于事件驱动的，因此无需将整个文档载入内存，使用者只需要监听自己感兴趣的事件即可。