Dom解析XML文档

最新推荐文章于 2024-11-03 16:43:24 发布

alex_zuo

最新推荐文章于 2024-11-03 16:43:24 发布

阅读量112

点赞数

分类专栏：再学JavaSE 文章标签： xml dom java

本文链接：https://blog.csdn.net/sisyphus_z/article/details/84355853

版权

再学JavaSE 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

<?xml version="1.0"?>
<PEOPLE>
	<PERSON PERSONID="E01">
		<NAME>Tony Blair</NAME>
		<ADDRESS>10 Downing Street, London, UK</ADDRESS>
		<TEL>(061) 98765</TEL>
		<FAX>(061) 98765</FAX>
		<EMAIL>blair@everywhere.com</EMAIL>
	</PERSON>
	<PERSON PERSONID="E02">
		<NAME>Bill Clinton</NAME>
		<ADDRESS>White House, USA</ADDRESS>
		<TEL>(001) 6400 98765</TEL>
		<FAX>(001) 6400 98765</FAX>
		<EMAIL>bill@everywhere.com</EMAIL>
	</PERSON>
	<PERSON PERSONID="E03">
		<NAME>Tom Cruise</NAME>
		<ADDRESS>57 Jumbo Street, New York, USA</ADDRESS>
		<TEL>(001) 4500 67859</TEL>
		<FAX>(001) 4500 67859</FAX>
		<EMAIL>cruise@everywhere.com</EMAIL>
	</PERSON>
	<PERSON PERSONID="E04">
		<NAME>Linda Goodman</NAME>
		<ADDRESS>78 Crax Lane, London, UK</ADDRESS>
		<TEL>(061) 54 56789</TEL>
		<FAX>(061) 54 56789</FAX>
		<EMAIL>linda@everywhere.com</EMAIL>
	</PERSON>
</PEOPLE>

package cn.sisy.xml;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

public class DomTest01 {
	public static void main(String[] args) throws Exception {
		
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dbf.newDocumentBuilder();
		Document document = db.parse("candidate.xml");
		//知道文档大概结构:PERSON
		NodeList list = document.getElementsByTagName("PERSON");

		for(int i = 0 ; i<list.getLength() ; i++){
			Element element = (Element) list.item(i);
			//获取元素的属性值，适用于知道属性名称的时候
			String content = element.getAttribute("PERSONID");
			System.out.print("属性值:"+content+"---");
			//节点类型
			short tag = element.getElementsByTagName("NAME").item(0)
				.getChildNodes().item(0).getNodeType();
			System.out.print("节点类型:"+tag+"---");
			//节点的名称，取决于其类型
			String name = element.getElementsByTagName("NAME").item(0)
			.getChildNodes().item(0).getNodeName();
			System.out.print("节点名称:"+name+"---");
			//节点的值
			String value = element.getElementsByTagName("NAME").item(0)
			.getChildNodes().item(0).getNodeValue();
			System.out.println("节点值："+value);
		}
	}
}

属性值:E01---节点类型:3---节点名称:#text---节点值：Tony Blair

属性值:E02---节点类型:3---节点名称:#text---节点值：Bill Clinton

属性值:E03---节点类型:3---节点名称:#text---节点值：Tom Cruise

属性值:E04---节点类型:3---节点名称:#text---节点值：Linda Goodman

package cn.sisy.xml;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class DomTest02 {
	public static void main(String[] args) throws Exception {
		
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dbf.newDocumentBuilder();
		Document document = db.parse("student.xml");
		
		//getDocumentElement()访问文档的或文档元素的子结点
		//文档的子结点就是文档的根元素结点,适用于不知道文档结构
		Element root = document.getDocumentElement();
		System.out.println("根元素："+root.getTagName());
		
		//获取根元素结点的所有子结点
		NodeList list = root.getChildNodes();
		for(int i = 0; i < list.getLength(); i++){
			//元素与子元素，元素与元素之间的空白也被当做了一个结点
			System.out.print(list.item(i).getNodeName());
		}

		//getTextContent():返回此节点及其后代的文本内容。
//		for(int i = 0; i < list.getLength(); i++){
//			Node n = list.item(i);			
//			System.out.print(n.getTextContent()+"--");
//		}
		System.out.println();
		NodeList nodeList = document.getElementsByTagName("学生");		
		for(int i = 0; i < nodeList.getLength(); i++){
			//用于获取元素的属性值：适用于不知道属性名称的情况下
			NamedNodeMap nnm = nodeList.item(i).getAttributes();
			for(int j = 0; j<nnm.getLength();j++){
				String attrName = nnm.item(j).getNodeName();
				System.out.print(attrName);		
				System.out.print("=");		
				String attrValue = nnm.item(j).getNodeValue();		
				System.out.print(attrValue+" ");
			}
			System.out.println();
		}
	}
}

根元素：学生名册

#text学生#text学生#text学生#text

准考证号=001 学号=1 教室号=001

准考证号=002 学号=2 教室号=002

准考证号=003 学号=3 教室号=003

<?xml version="1.0" encoding="UTF-8"?>
<学生名册 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="C:\Course30\student.xsd">
	<学生 学号="1" 准考证号="001" 教室号="001">
		<姓名>张三</姓名>
		<性别>男</性别>
		<年龄>20</年龄>
	</学生>
	<学生 学号="2" 准考证号="002" 教室号="002">
		<姓名>李四</姓名>
		<性别>女</性别>
		<年龄>19</年龄>
	</学生>
	<学生 学号="3" 准考证号="003" 教室号="003">
		<姓名>王五</姓名>
		<性别>男</性别>
		<年龄>21</年龄>
	</学生>
</学生名册>

package cn.sisy.xml;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Attr;
import org.w3c.dom.Comment;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

/**
 * 使用递归解析给定的任意一个xml文档并且将其内容输出到命令行上
 */
public class DomTest03 {
	public static void main(String[] args) throws Exception {
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dbf.newDocumentBuilder();

		Document doc = db.parse(new File("student.xml"));
		//获得根元素结点
		Element root = doc.getDocumentElement();

		parseElement(root);
	}

	private static void parseElement(Element element) {
		String tagName = element.getNodeName();

		NodeList children = element.getChildNodes();

		System.out.print("<" + tagName);

		//element元素的所有属性所构成的NamedNodeMap对象，需要对其进行判断
		NamedNodeMap map = element.getAttributes();
		//如果该元素存在属性
		if (null != map) {
			//map.getLength()此映射中的节点数
			for (int i = 0; i < map.getLength(); i++) {
				//获得该元素的每一个属性
				Attr attr = (Attr) map.item(i);
				String attrName = attr.getName();
				String attrValue = attr.getValue();

				System.out.print(" " + attrName + "=\"" + attrValue + "\"");
			}
//			System.out.println(map.getLength());
		}

		System.out.print(">");

		for (int i = 0; i < children.getLength(); i++) {
			Node node = children.item(i);
			//获得结点的类型
			short nodeType = node.getNodeType();

			if (nodeType == Node.ELEMENT_NODE) {
				//是元素，继续递归
				parseElement((Element) node);
			} else if (nodeType == Node.TEXT_NODE) {
				//递归出口
				System.out.print(node.getNodeValue());
			} else if (nodeType == Node.COMMENT_NODE) {
				System.out.print("<!--");

				Comment comment = (Comment) node;

				//注释内容
				String data = comment.getData();

				System.out.print(data);

				System.out.print("-->");
			}
		}

		System.out.print("</" + tagName + ">");
	}
}