java对xml文件的解析_Java对XML文件的解析

XML简介

围绕XML涉及到四方面的技术:

1、数据定义Schema、DTD

2、数据解析DOM、SAX两种解析模型

3、样式风格XSTL,使用XSTL可以将XML文件中存放的内容按照指定的样式显示为HTML页面

4、实现语言JAVA,NET,JavaScript等,几乎所有的程序语言都提供支持。所有操作XML的功能都有额外的语言提供。另Java中可以使用SAX、JDOM、dom4j等API操作XML数据。

基本语法:

声明<?xml version=”1.0” encoding=”UTF-8”?>

XML声明不属于xml元素,所以不需要结束标记。

XML文档只有一个根元素,必须包含一个单独的标记来定义整个文档。

XML是大小写敏感的。

转移字符:当某个节点的数据包含大量需要转义的字符时,可以使用CDATA

以结束,其所包含的文本都会被当做普通文本处理,所有的特殊符号都会被忽略掉。但其中不能再包含CDATA,注意标签不能有空格。

XML解析

DOM解析

DOM解析(Document Object Mode)是一种基于对象的API,它把XML的内容加载到内存中,生成一个与XML文档内容对应的对象模型。当解析完成时,内存中会生成与XML文档的结构对应的DOM对象树。这样便能够根据树的结构,以节点形式来对文档进行操作。

特点:对于小的XML文件这样处理很方便,但遇到大的XML文件时,DOM解析占用内存比较大,而且查找速度比较慢。

通过以下三个步骤创建XML文件对应的Document对象:

DocumentBuilderFactorybuilderFactory = DocumentBuilderFactory.newInstance();

DocumentBuilder builder =builderFactory.newDocumentBuilder();

Document document = builder.parse(file);

其他方法可参考JDK,javax.xml.*; org.w3c.dom.

SAX解析

SAX解析器对XML文档解析会从XML文档开始位置起进行解析,同时根据已经定义好的事件处理器,来决定当前所解析的部分(元素、属性或元素内容)是否有必要记录并存储。

特点:效率比DOM解析优越。

SAX解析是事件驱动的,需要定义一个事件监听对象(可继承DefaultHandler类)

通过如下三个步骤建立XML解析对象:

SAXParserFactory factory = SAXParserFactory.newInstance();

SAXParser parser = factory.newSAXParser();

parser.parse(newFile(""),newDefaultHandler());

其他具体方法可参考JDK:org.xml.sax.*; javax.xml.parsers.

DOM和SAX都是JDK提供的解析XML的API,但是在实际开发中很少用到,因为要重新编写大量的代码。

XML与Java类(POJO类)映射JAXB

Java对象转化成XML,marshal

XML转化为Java对象,unmarshal

此方法也是JDK提供的:javax.xml.bind.*

注解:

Dom4j

dom4j的一个工具类:package com.xml.dom4j;

import java.io.FileWriter;

import java.io.IOException;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import org.dom4j.Document;

import org.dom4j.Element;

import org.dom4j.XPath;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.XMLWriter;

/**

*dom4j的学习可参考官网

*下载官网:

*http://sourceforge.net/projects/dom4j/files/dom4j-2.0.0-ALPHA-2/

*学习详细用法可参考具体官方API接口文档说明

*/

public class XmlUtil {

/**

* tagName=list

* 理解element是什么东西

* Element interface defines an XML element.

* An element can have declared namespaces, attributes, child nodes and textual content

* http://hi.daidu.com/331703405/item/d3a7388916fcc8d75e0c1d1

* @param document

* @param nameSpace

* @param tagName

* @return

*/

public static List getElementsByNameSpace(Document document, String nameSpace, String tagName){

Map map = new HashMap();

map.put("ns", nameSpace);

XPath xPath = document.createXPath("//ns:" + tagName);

xPath.setNamespaceURIs(map);

List list = xPath.selectNodes(document);

return list;

}

/**

* 一般项目处理的时候也可用字符串StringBuffer拼接报文

* 当大量的xml需要的时侯可用模板Freemarker模块

* @param document

* @throws IOException

* 来自官网API说明文档

*/

public void write(Document document) throws IOException {

// lets write to a file

XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));

writer.write(document);

writer.close();

// Pretty print the document to System.out

OutputFormat format = OutputFormat.createPrettyPrint();

writer = new XMLWriter( System.out, format);

writer.write(document);

// Compact format to System.out

format = OutputFormat.createCompactFormat();

writer = new XMLWriter(System.out, format);

writer.write(document);

}

/**

* tagPaht = root.response.list

* @param document

* @param tagPath

* @return

*/

public static List getElementsByTagPath(Document document, String tagPath){

List list = null;

Element root = document.getRootElement();

String[] tags = tagPath.split("\\.");

if(tags[0].equals(root.getName())){

Element element = root;

for (int i = 1; i < tags.length; i++) {

if(i < tags.length - 1){

element = element.element(tags[i]);

if(element == null) break;

}else{

list = element.elements(tags[i]);

}

}

}

return list;

}

/**

* 通过路径获取标签值

* tagPath = root.response.name

* @param document

* @param tagPath

* @return

*/

public static String getElementTextByTagPath(Document document, String tagPath){

String text = "";

Element root = document.getRootElement();

String[] tags = tagPath.split("\\.");

if(tags[0].equals(root.getName())){

Element element = root;

for (int i = 1; i < tags.length; i++) {

if(i < tags.length - 1){

element = element.element(tags[i]);

if(element == null) break;

}else{

text = element.elementText(tags[i]);

}

}

}

return text;

}

}

JDOM

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值