- JAXP解析
JAXP 是sun公司推出的一套解析XML文档的API,该API是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成
JAXP支持两种方式(DOM和SAX)对XML文档进行解析,两种方式思路类似,都需要通过调用工厂类得方法来获得解析器,进而通过解析器对文档进行解析
boo.xml :
<?xml version="1.0" encoding="UTF-8"?>
<书架>
<书>
<书名>Java核心技术</书名>
<作者 id="ccc">Gary</作者>
<售价>39.00元</售价>
</书>
<书>
<书名>JavaScript网页开发</书名>
<作者>Tom</作者>
<售价>28.00元</售价>
<出版社 name="xxxx" id="111" location="北京">人民出版社</出版社>
</书>
</书架>
Dom解析
处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问
package com.my.xml.jaxp;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
public class Demo1 {
public static void main(String[] args) throws Exception {
// 1. 创建工厂对象
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 2. 实例化解析器对象
DocumentBuilder builder = factory.newDocumentBuilder();
// 3. 解析xml文档 获得Document
Document document = builder.parse("src/book.xml");
// 4. 通过Document去获得指定的元素
// 读取第一本书的书名
NodeList nodeList = document.getElementsByTagName("书");
Node bookNode = nodeList.item(0);
Node textNode = bookNode.getFirstChild();
Node booknameNode = textNode.getNextSibling();
String data = booknameNode.getTextContent();
System.out.println(data);
// 根据id 获得节点
Element element = document.getElementById("aa");
System.out.println(element.getTagName());
}
}
Sax解析
SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问
Sax实例1:
package com.my.xml.jaxp;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
//sax 解析
public class Demo2 {
public static void main(String[] args) throws Exception{
// 创建工厂
SAXParserFactory factory = SAXParserFactory.newInstance();
// 创建解析器
SAXParser parser = factory.newSAXParser();
// 通过解析器获得内部读取器
XMLReader reader = parser.getXMLReader();
// 绑定内容处理器
reader.setContentHandler(new MyContentHandler());
// 读取xml文件
reader.parse("src/book.xml");
}
}
class MyContentHandler implements ContentHandler {
@Override
public void setDocumentLocator(Locator locator) {
// TODO Auto-generated method stub
}
@Override
public void startDocument() throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void endDocument() throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void startPrefixMapping(String prefix, String uri)
throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void endPrefixMapping(String prefix) throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void startElement(String uri, String localName, String qName,
Attributes atts) throws SAXException {
System.out.println("<" + qName + ">");
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
System.out.println("</" + qName + ">");
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
System.out.println(new String(ch, start, length));
}
@Override
public void ignorableWhitespace(char[] ch, int start, int length)
throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void processingInstruction(String target, String data)
throws SAXException {
// TODO Auto-generated method stub
}
@Override
public void skippedEntity(String name) throws SAXException {
// TODO Auto-generated method stub
}
}
Sax实例2:
package com.my.xml.jaxp;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class Demo3 {
/**
* @param args
*/
public static void main(String[] args) throws Exception {
// 读取第一本书的价格
SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
XMLReader reader = parser.getXMLReader();
reader.setContentHandler(new MyContentHandler1());
reader.parse("src/book.xml");
}
}
class MyContentHandler1 extends DefaultHandler {
private boolean test = false;
private int num = 1;
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
if("售价".equals(qName)) {
test = true;
}
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if("售价".equals(qName)) {
test = false;
num++;
}
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if(test && num==2) {
String data = new String(ch, start, length);
System.out.println(data);
}
}
}
2.Dom4j解析
Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j。
jar包:dom4j-1.6.1.jar,jaxen-1.1-beta-6.jar
package com.my.xml.dom4j;
import java.io.FileOutputStream;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;
public class Dom4jTest {
@Test
public void test1() throws Exception {
// 读第二本书的书名
// 加载文档
Document document = parse();
// 获得根元素
Element root = document.getRootElement();
//Element bookElement = root.element("书");
Element bookElement = (Element) root.elements("书").get(1);
Element booknameElement = bookElement.element("书名");
String text = booknameElement.getText();
System.out.println(text);
}
@Test
public void test2() throws Exception {
// 加载文档
Document document = parse();
// 删除第一本书的第二个售价
// 获得
Element rootElement = document.getRootElement();
Element bookElement = rootElement.element("书");
Element priceElement = (Element) bookElement.elements("售价").get(1);
// 删除
bookElement.remove(priceElement);
// 写入文档
write2Xml(document);
}
@Test
public void test3() throws Exception {
// 加载文档
Document document = parse();
// 第一本书的作者的id修改为cc
// 获得
Element rootElement = document.getRootElement();
Element authorElement = rootElement.element("书").element("作者");
// 修改
authorElement.addAttribute("id", "ccc");
// 写入文档
write2Xml(document);
}
@Test
public void test4() throws Exception {
// 加载文档
Document document = parse();
// 为第二本书添加一个出版社子节点
// 获得
Element rootElement = document.getRootElement();
Element bookElement = (Element) rootElement.elements("书").get(1);
// 添加
bookElement.addElement("出版社")
.addAttribute("name", "xxxx")
.addAttribute("id", "111")
.addAttribute("location", "北京")
.addText("人民出版社");
// 写入文档
write2Xml(document);
}
private void write2Xml(Document document) throws Exception {
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format );
writer.write( document );
writer.close();
}
// 解析 xml
public Document parse() throws DocumentException {
SAXReader reader = new SAXReader();
Document document = reader.read("src/book.xml");
return document;
}
}