要求
必备知识
JAVA基础知识。XML基础知识。
开发环境
MyEclipse10
资料下载
sax、dom是两种对xml文档进行解析的方法(没有具体实现,只是接口),所以只有它们是无法解析xml文档的;jaxp只是api,它进一步封装了sax、dom两种接口,并且提供了DomcumentBuilderFactory/DomcumentBuilder和SAXParserFactory/SAXParser(默认使用xerces解释器)。
如对DOM解析器还有疑问,请查看这里。目前在Java中用于解析XML的技术很多,主流的有DOM、SAX、JDOM、DOM4j,下面分别介绍这四种方式如何操作DOM。
university.xml
dom读写xml 输出属性值,此方法我已经到上篇随笔中有详细介绍了,点这里查看.
TestDom.java
importjava.io.File;importjava.io.FileNotFoundException;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parsers.DocumentBuilderFactory;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.transform.Transformer;importjavax.xml.transform.TransformerConfigurationException;importjavax.xml.transform.TransformerException;importjavax.xml.transform.TransformerFactory;importjavax.xml.transform.dom.DOMSource;importjavax.xml.transform.stream.StreamResult;importorg.w3c.dom.Document;importorg.w3c.dom.Element;importorg.w3c.dom.Node;importorg.w3c.dom.NodeList;importorg.w3c.dom.Text;importorg.xml.sax.SAXException;/*** dom读写xml 输出属性值
*@authorwhwang*/
public classTestDom {public static voidread() {
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();try{
DocumentBuilder builder=dbf.newDocumentBuilder();
InputStream in= TestDom.class.getClassLoader().getResourceAsStream("university.xml"); //读取src目录下文件
Document doc =builder.parse(in);
Element root= doc.getDocumentElement(); //获取根元素
if (root == null) return;
System.err.println(root.getAttribute("name")); //获取根元素的name属性值
NodeList collegeNodes= root.getChildNodes();//根元素下的所有子元素
if (collegeNodes == null) return;/*** 循环所有的根元素下的所有只节点
* 根元素下所有的college 节点*/
for(int i = 0; i < collegeNodes.getLength(); i++) {
Node college=collegeNodes.item(i);if (college != null && college.getNodeType() ==Node.ELEMENT_NODE) {
System.err.println("\t" + college.getAttributes().getNamedItem("name").getNodeValue()); //获取节点 name属性值//所有的class节点
NodeList classNodes =college.getChildNodes();if (classNodes == null) continue;for (int j = 0; j < classNodes.getLength(); j++) {
Node clazz=classNodes.item(j);if (clazz != null && clazz.getNodeType() ==Node.ELEMENT_NODE) {
System.err.println("\t\t" + clazz.getAttributes().getNamedItem("name").getNodeValue());//所有的student节点
NodeList studentNodes =clazz.getChildNodes();if (studentNodes == null) continue;for (int k = 0; k < studentNodes.getLength(); k++) {
Node student=studentNodes.item(k);if (student != null && student.getNodeType() ==Node.ELEMENT_NODE) {
System.err.print("\t\t\t" + student.getAttributes().getNamedItem("name").getNodeValue());
System.err.print(" " + student.getAttributes().getNamedItem("sex").getNodeValue());
System.err.println(" " + student.getAttributes().getNamedItem("age").getNodeValue());
}
}
}
}
}
}
}catch(ParserConfigurationException e) {
e.printStackTrace();
}catch(FileNotFoundException e) {
e.printStackTrace();
}catch(SAXException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}
}/*** 读取本地XML文件 修改后另存为*/
public static voidwrite() {
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();try{
DocumentBuilder builder=dbf.newDocumentBuilder();
InputStream in= TestDom.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=builder.parse(in);//根节点
Element root =doc.getDocumentElement();if (root == null) return;//修改属性
root.setAttribute("name", "tsu"); //给根元素添加 name属性和属性值
NodeList collegeNodes =root.getChildNodes();if (collegeNodes != null) {for (int i = 0; i
Node college =collegeNodes.item(i);if (college.getNodeType() ==Node.ELEMENT_NODE) {
String collegeName= college.getAttributes().getNamedItem("name").getNodeValue();if ("c1".equals(collegeName) || "c2".equals(collegeName)) {
root.removeChild(college);
}else if ("c3".equals(collegeName)) {
Element newChild= doc.createElement("class");
newChild.setAttribute("name", "c4");
college.appendChild(newChild);
}
}
}
}//新增节点
Element addCollege = doc.createElement("college");
addCollege.setAttribute("name", "c5");
root.appendChild(addCollege);
Text text= doc.createTextNode("text");
addCollege.appendChild(text);//将修改后的文档保存到文件
TransformerFactory transFactory =TransformerFactory.newInstance();
Transformer transFormer=transFactory.newTransformer();
DOMSource domSource= newDOMSource(doc);
File file= new File("src/dom-modify.xml");if(file.exists()) {
file.delete();
}
file.createNewFile();
FileOutputStream out= newFileOutputStream(file);
StreamResult xmlResult= newStreamResult(out);
transFormer.transform(domSource, xmlResult);
System.out.println(file.getAbsolutePath());//获取文件的据对路径
} catch(ParserConfigurationException e) {
e.printStackTrace();
}catch(SAXException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}catch(TransformerConfigurationException e) {
e.printStackTrace();
}catch(TransformerException e) {
e.printStackTrace();
}
}public static voidmain(String[] args) {
read();//write();
}
}
SAX不用将整个文档加载到内存,基于事件驱动的API(Observer模式),用户只需要注册自己感兴趣的事件即可。SAX提供EntityResolver, DTDHandler, ContentHandler, ErrorHandler接口,分别用于监听解析实体事件、DTD处理事件、正文处理事件和处理出错事件,与AWT类似,SAX还提供了一个对这4个接口默认的类DefaultHandler(这里的默认实现,其实就是一个空方法),一般只要继承DefaultHandler.
TestSAX.java
importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.parsers.SAXParser;importjavax.xml.parsers.SAXParserFactory;importorg.xml.sax.Attributes;importorg.xml.sax.InputSource;importorg.xml.sax.Locator;importorg.xml.sax.SAXException;importorg.xml.sax.SAXParseException;importorg.xml.sax.helpers.DefaultHandler;/***
*@authorwhwang*/
public classTestSAX {public static voidmain(String[] args) {
read();
write();
}public static voidread() {try{
SAXParserFactory factory=SAXParserFactory.newInstance();
SAXParser parser=factory.newSAXParser();
InputStream in= TestSAX.class.getClassLoader().getResourceAsStream("university.xml");
parser.parse(in,newMyHandler());
}catch(ParserConfigurationException e) {
e.printStackTrace();
}catch(SAXException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}
}public static voidwrite() {
System.err.println("纯SAX对于写操作无能为力");
}
}//重写对自己感兴趣的事件处理方法
class MyHandler extendsDefaultHandler {
@OverridepublicInputSource resolveEntity(String publicId, String systemId)throwsIOException, SAXException {return super.resolveEntity(publicId, systemId);
}
@Overridepublic voidnotationDecl(String name, String publicId, String systemId)throwsSAXException {super.notationDecl(name, publicId, systemId);
}
@Overridepublic voidunparsedEntityDecl(String name, String publicId,
String systemId, String notationName)throwsSAXException {super.unparsedEntityDecl(name, publicId, systemId, notationName);
}
@Overridepublic voidsetDocumentLocator(Locator locator) {super.setDocumentLocator(locator);
}
@Overridepublic void startDocument() throwsSAXException {
System.err.println("开始解析文档");
}
@Overridepublic void endDocument() throwsSAXException {
System.err.println("解析结束");
}
@Overridepublic voidstartPrefixMapping(String prefix, String uri)throwsSAXException {super.startPrefixMapping(prefix, uri);
}
@Overridepublic void endPrefixMapping(String prefix) throwsSAXException {super.endPrefixMapping(prefix);
}
@Overridepublic voidstartElement(String uri, String localName, String qName,
Attributes attributes)throwsSAXException {
System.err.print("Element: " + qName + ", attr: ");
print(attributes);
}
@Overridepublic voidendElement(String uri, String localName, String qName)throwsSAXException {super.endElement(uri, localName, qName);
}
@Overridepublic void characters(char[] ch, int start, intlength)throwsSAXException {super.characters(ch, start, length);
}
@Overridepublic void ignorableWhitespace(char[] ch, int start, intlength)throwsSAXException {super.ignorableWhitespace(ch, start, length);
}
@Overridepublic voidprocessingInstruction(String target, String data)throwsSAXException {super.processingInstruction(target, data);
}
@Overridepublic void skippedEntity(String name) throwsSAXException {super.skippedEntity(name);
}
@Overridepublic void warning(SAXParseException e) throwsSAXException {super.warning(e);
}
@Overridepublic void error(SAXParseException e) throwsSAXException {super.error(e);
}
@Overridepublic void fatalError(SAXParseException e) throwsSAXException {super.fatalError(e);
}private voidprint(Attributes attrs) {if (attrs == null) return;
System.err.print("[");for (int i = 0; i < attrs.getLength(); i++) {
System.err.print(attrs.getQName(i)+ " = " +attrs.getValue(i));if (i != attrs.getLength() - 1) {
System.err.print(", ");
}
}
System.err.println("]");
}
}
JDOM与DOM非常类似,它是处理XML的纯JAVA API,API大量使用了Collections类,且JDOM仅使用具体类而不使用接口。 JDOM 它自身不包含解析器。它通常使用 SAX2 解析器来解析和验证输入 XML 文档(尽管它还可以将以前构造的 DOM 表示作为输入)。它包含一些转换器以将 JDOM 表示输出成 SAX2 事件流、DOM 模型或 XML 文本文档。
TestJDom.java
importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.util.List;importorg.jdom.Attribute;importorg.jdom.Document;importorg.jdom.Element;importorg.jdom.JDOMException;importorg.jdom.input.SAXBuilder;importorg.jdom.output.XMLOutputter;/*** JDom读写xml
*@authorwhwang*/
public classTestJDom {public static voidmain(String[] args) {
read();
write();
}public static voidread() {try{boolean validate = false;
SAXBuilder builder= newSAXBuilder(validate);
InputStream in= TestJDom.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=builder.build(in);//获取根节点
Element root =doc.getRootElement();
readNode(root,"");
}catch(JDOMException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}
}
@SuppressWarnings("unchecked")public static voidreadNode(Element root, String prefix) {if (root == null) return;//获取属性
List attrs =root.getAttributes();if (attrs != null && attrs.size() > 0) {
System.err.print(prefix);for(Attribute attr : attrs) {
System.err.print(attr.getValue()+ " ");
}
System.err.println();
}//获取他的子节点
List childNodes =root.getChildren();
prefix+= "\t";for(Element e : childNodes) {
readNode(e, prefix);
}
}public static voidwrite() {boolean validate = false;try{
SAXBuilder builder= newSAXBuilder(validate);
InputStream in= TestJDom.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=builder.build(in);//获取根节点
Element root =doc.getRootElement();//修改属性
root.setAttribute("name", "tsu");//删除
boolean isRemoved = root.removeChildren("college");
System.err.println(isRemoved);//新增
Element newCollege = new Element("college");
newCollege.setAttribute("name", "new_college");
Element newClass= new Element("class");
newClass.setAttribute("name", "ccccc");
newCollege.addContent(newClass);
root.addContent(newCollege);
XMLOutputter out= newXMLOutputter();
File file= new File("src/jdom-modify.xml");if(file.exists()) {
file.delete();
}
file.createNewFile();
FileOutputStream fos= newFileOutputStream(file);
out.output(doc, fos);
}catch(JDOMException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}
}
}
dom4j是目前在xml解析方面是最优秀的(Hibernate、Sun的JAXM也都使用dom4j来解析XML),它合并了许多超出基本 XML 文档表示的功能,包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理
TestDom4j.java
importjava.io.File;importjava.io.FileWriter;importjava.io.IOException;importjava.io.InputStream;importjava.util.List;importorg.dom4j.Attribute;importorg.dom4j.Document;importorg.dom4j.DocumentException;importorg.dom4j.DocumentHelper;importorg.dom4j.Element;importorg.dom4j.ProcessingInstruction;importorg.dom4j.VisitorSupport;importorg.dom4j.io.SAXReader;importorg.dom4j.io.XMLWriter;/*** Dom4j读写xml
*@authorwhwang*/
public classTestDom4j {public static voidmain(String[] args) {
read1();//read2();
write();
}public static voidread1() {try{
SAXReader reader= newSAXReader();
InputStream in= TestDom4j.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=reader.read(in);
Element root=doc.getRootElement();
readNode(root,"");
}catch(DocumentException e) {
e.printStackTrace();
}
}
@SuppressWarnings("unchecked")public static voidreadNode(Element root, String prefix) {if (root == null) return;//获取节点的属性
List attrs =root.attributes();if (attrs != null && attrs.size() > 0) {
System.err.print(prefix);for(Attribute attr : attrs) {
System.err.print(attr.getValue()+ " ");
}
System.err.println();
}//获取他的子节点
List childNodes =root.elements();
prefix+= "\t";for(Element e : childNodes) {
readNode(e, prefix);
}
}public static voidread2() {try{
SAXReader reader= newSAXReader();
InputStream in= TestDom4j.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=reader.read(in);
doc.accept(newMyVistor());
}catch(DocumentException e) {
e.printStackTrace();
}
}/*** 写入方法*/
public static voidwrite() {try{//创建一个xml文档
Document doc =DocumentHelper.createDocument();
Element university= doc.addElement("university");
university.addAttribute("name", "tsu");//注释
university.addComment("这个是根节点");
Element college= university.addElement("college");
college.addAttribute("name", "cccccc");
college.setText("text");
File file= new File("src/dom4j-modify.xml");if(file.exists()) {
file.delete();
}
file.createNewFile();
XMLWriter out= new XMLWriter(newFileWriter(file));
out.write(doc);
out.flush();
out.close();
}catch(IOException e) {
e.printStackTrace();
}
}
}class MyVistor extendsVisitorSupport {public voidvisit(Attribute node) {
System.out.println("Attibute: " + node.getName() + "="
+node.getValue());
}public voidvisit(Element node) {if(node.isTextOnly()) {
System.out.println("Element: " + node.getName() + "="
+node.getText());
}else{
System.out.println(node.getName());
}
}
@Overridepublic voidvisit(ProcessingInstruction node) {
System.out.println("PI:" + node.getTarget() + " " +node.getText());
}
}
由于DOM4J比较重要我到网上还整理了一些代码:
Dom4j.java
importjava.io.File;importjava.io.FileOutputStream;importjava.io.FileWriter;importjava.io.IOException;importjava.io.OutputStream;importjava.io.OutputStreamWriter;importjava.io.UnsupportedEncodingException;importjava.net.URL;importjava.util.Iterator;importjava.util.List;importorg.dom4j.Attribute;importorg.dom4j.Document;importorg.dom4j.DocumentHelper;importorg.dom4j.Element;importorg.dom4j.Node;importorg.dom4j.io.OutputFormat;importorg.dom4j.io.SAXReader;importorg.dom4j.io.XMLWriter;public classDom4j {/*** 获取Document对象
* 此方法文件位于 项目根目录 不是src目录
*@paramfilename 项目根目录下的XML文件
*@returndocument
**/
public staticDocument load(String filename) {
Document document= null;try{
SAXReader saxReader= newSAXReader();
document= saxReader.read(new File(filename)); //读取XML文件,获得document对象
} catch(Exception ex) {
ex.printStackTrace();
}returndocument;
}/*** 通过url路径获取 Document对象
* 此方式 xml文件位于远程服务器上
*@paramurl 远程url文件
*@returndocument对象*/
public staticDocument load2(URL url) {
Document document= null;try{
SAXReader saxReader= newSAXReader();
document= saxReader.read(url); //读取XML文件,获得document对象
} catch(Exception ex) {
ex.printStackTrace();
}returndocument;
}/*** 获取根节点
*@paramdoc document对象
*@return根元素*/
public staticElement getRootElement(Document doc){
Element root=null;
root=doc.getRootElement(); //获取根节点
returnroot;
}/*** 将document树输出到指定的文件
*@paramdocument document对象
*@paramfilename 文件名
*@return布尔值*/
public static booleandoc2XmlFile(Document document, String filename) {boolean flag = true;try{
XMLWriter writer= new XMLWriter( new OutputStreamWriter(new FileOutputStream(filename),"UTF-8"));
writer.write(document);
writer.close();
}catch(Exception ex) {
flag= false;
ex.printStackTrace();
}
System.out.println(flag);returnflag;
}/***
*
* 此方法在本类中无用 ,没有整合 有兴趣的可以自己动手整合一下
*
*
* Dom4j通过XMLWriter将Document对象表示的XML树写入指定的文件,
* 并使用OutputFormat格式对象指定写入的风格和编码方法。
* 调用OutputFormat.createPrettyPrint()方法可以获得一个默认的pretty print风格的格式对象。
* 对OutputFormat对象调用setEncoding()方法可以指定XML文件的编码方法。
*@paramdoc
*@paramout
*@paramencoding
*@throwsUnsupportedEncodingException
*@throwsIOException*/
/*public void writeTo(Document doc,OutputStream out, String encoding) throws UnsupportedEncodingException, IOException {
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("gb2312");
XMLWriter writer = new XMLWriter(System.out,format);
writer.write(doc);
writer.flush();
}*/
/*** 遍历根标记下的子元素
*@paramargs*/
public static voidread(Element root){for(Iterator i=root.elementIterator();i.hasNext();){
Element element=(Element)i.next();
System.out.print(element.getName()+":"+element.getText());if(element.getNodeType()==Node.ELEMENT_NODE){
read(element);
}
}
}/*** 写入操作
*@paramfileName*/
public static voidwrite(String fileName){
Document document=DocumentHelper.createDocument();//建立document对象,用来操作xml文件
Element booksElement=document.addElement("books");//建立根节点
booksElement.addComment("This is a test for dom4j ");//加入一行注释
Element bookElement=booksElement.addElement("book");//添加一个book节点
bookElement.addAttribute("show","yes");//添加属性内容
Element titleElement=bookElement.addElement("title");//添加文本节点
titleElement.setText("ajax in action");//添加文本内容
try{
XMLWriter writer=new XMLWriter(new FileWriter(newFile(fileName)));
writer.write(document);
writer.close();
}catch(Exception e){
e.printStackTrace();
}
}/*** 修改XML文件*/
public static voidmodifyXMLFile() {
String oldStr= "test.xml";
String newStr= "test1.xml";
Document document= null;//修改节点的属性
try{
SAXReader saxReader= new SAXReader(); //用来读取xml文档
document = saxReader.read(new File(oldStr)); //读取xml文档
List list = document.selectNodes("/books/book/@show");//用xpath查找节点book的属性
Iterator iter =list.iterator();while(iter.hasNext()) {
Attribute attribute=(Attribute) iter.next();if (attribute.getValue().equals("yes"))
attribute.setValue("no");
}
}catch(Exception e) {
e.printStackTrace();
}//修改节点的内容
try{
SAXReader saxReader= new SAXReader(); //用来读取xml文档
document = saxReader.read(new File(oldStr)); //读取xml文档
List list = document.selectNodes("/books/book/title");//用xpath查找节点book的内容
Iterator iter =list.iterator();while(iter.hasNext()) {
Element element=(Element) iter.next();
element.setText("xxx");//设置相应的内容
}
}catch(Exception e) {
e.printStackTrace();
}try{
XMLWriter writer= new XMLWriter(new FileWriter(newFile(newStr)));
writer.write(document);
writer.close();
}catch(Exception ex) {
ex.printStackTrace();
}
}public static voidmain(String[] args){
Document doc=load("student.xml");
Element root=getRootElement(doc);
read(root);
write("test.xml");
modifyXMLFile();
}
}
XPath 是一门在 XML 文档中查找信息的语言, 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此,对 XPath 的理解是很多高级 XML 应用的基础。
XPath非常类似对数据库操作的SQL语言,或者说JQuery,它可以方便开发者抓起文档中需要的东西。(dom4j也支持xpath, dom4j使用xpath请点击这里)
TestXPath.java
importjava.io.IOException;importjava.io.InputStream;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parsers.DocumentBuilderFactory;importjavax.xml.parsers.ParserConfigurationException;importjavax.xml.xpath.XPath;importjavax.xml.xpath.XPathConstants;importjavax.xml.xpath.XPathExpression;importjavax.xml.xpath.XPathExpressionException;importjavax.xml.xpath.XPathFactory;importorg.w3c.dom.Document;importorg.w3c.dom.NodeList;importorg.xml.sax.SAXException;/***
* 普通DOM与XPath
*@authorlicheng
**/
public classTestXPath {public static voidmain(String[] args) {
read();
}public static voidread() {try{
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=dbf.newDocumentBuilder();
InputStream in= TestXPath.class.getClassLoader().getResourceAsStream("university.xml");
Document doc=builder.parse(in);
XPathFactory factory=XPathFactory.newInstance();
XPath xpath=factory.newXPath();//选取所有class元素的name属性//XPath语法介绍:http://w3school.com.cn/xpath/
XPathExpression expr = xpath.compile("//class/@name");
NodeList nodes=(NodeList) expr.evaluate(doc, XPathConstants.NODESET);for (int i = 0; i < nodes.getLength(); i++) {
System.out.println("name = " +nodes.item(i).getNodeValue());
}
}catch(XPathExpressionException e) {
e.printStackTrace();
}catch(ParserConfigurationException e) {
e.printStackTrace();
}catch(SAXException e) {
e.printStackTrace();
}catch(IOException e) {
e.printStackTrace();
}
}
}
不知为何,博客园每天只能到发表一篇随笔,发第二篇的时候不能到首页显示。
利用JAVA,将XML文件导入数据库,和将数据库信息导入到XML的笔记将到将到明后两天发布。
最后将分享一个利用XML当数据库,查询英语六级词汇的案例,下面先分享一下截图吧:
实例将到明后两天分享。请多多关注哟。
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。