XML Java编程-CSDN博客

本文链接：https://blog.csdn.net/liudanlinux/article/details/8601564

一、XML概述
1、XML是可扩展标记语言。是由W3C指定并维护的，目前最新的版本是1.0
2、XML作用：
2.1传输数据，它是一种通用的数据交换格式
2.2配置文件。
二、xml语法
1、XML的声明
1.1语法：<?xml version="1.0" encoding="UTF-8"?>
保存在磁盘上的文件编码要与声明的编码一致。
encoding属性的默认编码是：UTF-8
1.2XML的声明必须出现在XML文档的第一行
2、XML的注释
2.1语法：
2.2注释不能出现在声明之前
3、CDATA区
CDATA是Character Data的缩写
把标签当做普通文本内容；
示例：
<![CDATA[
<itcast>www.itcast.cn</itcast>
]]>
三、DTD约束
1、常用约束：DTD（Document Type Definition）文档类型定义
Schema
2、格式良好的XML：遵循XML语法的文档
有效的XML：遵守约束的文档。
有效的XML文档一定是格式良好的，但格式良好的不一定是有效的
3、单独的DTD文档在保存时要以UTF-8编码进行保存
4、编写DTD
4.1在XML文档中直接编写：
<?xml version="1.0" encoding="gbk"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架/>
4.2引入外部DTD
4.2.1：当引用的DTD文档在本地时，采用如下方式：
<!DOCTYPE 根元素 SYSTEM “DTD文档路径”>
4.2.2：当引用的DTD文档在公共网络上时，采用如下方式：
<!DOCTYPE 根元素 PUBLIC “DTD名称” “DTD文档的URL”>
5、定义元素：
语法：<!ELEMENT 元素名称使用规则>
使用规则：
(#PCDATA):表示标签主体内容为普通字符串
EMPTY:表示标签没有主体内容
ANY:主体为任意内容
(子元素)：标签中的子元素
用逗号分开：按顺序出现
用“|”：选择其中一个
出现次数：
如果元素后面没有+*?:表示必须且只能出现一次
+:表示至少出现一次，一次或多次
*：表示可有可无，零次、一次或多次
?:表示可以有也可以无，有的话只能有一次。零次或一次
6、定义元素的属性
语法：<!ATTLIST 元素名称
属性名称1 属性值类型设置说明
属性名称2 属性值类型设置说明
....
>
属性值类型：
CDATA：普通文本数据
A|B|C "A":表示枚举值，只能从A、B、C中取其中一个，A为默认值
ID：表示取值不能重复
设置说明：
#REQUIRED：表示该属性必须出现
#IMPLIED：表示该属性可有可无
#FIXED:表示属性的取值为一个固定值。语法：#FIXED "固定值"

直接值：表示属性的取值为该默认值

StudentDao：

package com.it.dao;

import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.TransformerException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import com.it.model.Student;
import com.it.xmlUtil.XMLUtil;

public class StudentDao {
	
	public void add(Student s) throws ParserConfigurationException, SAXException, IOException, TransformerException {
		//得到Document对象
		Document doc = XMLUtil.getDocument();
		//构建Student相关的所有Element
		Element e_student = doc.createElement("student");
		e_student.setAttribute("school_id", s.getSchool_id());
		e_student.setAttribute("card_id", s.getCard_id());
		Element e_name = doc.createElement("name");
		e_name.setTextContent(s.getName());
		Element e_add = doc.createElement("add");
		e_add.setTextContent(s.getAdd());
		Element e_phone = doc.createElement("phone");
		e_phone.setTextContent(s.getPhone());
		//建立Element之间的关系
		e_student.appendChild(e_name);
		e_student.appendChild(e_add);
		e_student.appendChild(e_phone);
		doc.getElementsByTagName("exam").item(0).appendChild(e_student);
		//将添加了学生的Element保存
		XMLUtil.saveXML(doc);
	}
	
	public boolean delete(String school_id) throws ParserConfigurationException, SAXException, IOException, TransformerException {
		boolean result = false;
		//得到Document
		Document doc = XMLUtil.getDocument();
		//得到所有的Student节点
		NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
		//遍历所有的student
		for(int i = 0;i<list.getLength();i++) {
			Node node = list.item(i);
			if(node.getNodeType() == Node.ELEMENT_NODE) {
				Element el = (Element)node;
				//找到需要删除的节点，用他的父节点删除之
				if(el.getAttribute("school_id").equals(school_id)) {
					node.getParentNode().removeChild(node);
					result = true;
				}
			}
			
		}
		XMLUtil.saveXML(doc);
		return result;
	}
	
	public Student search(String school_id) throws ParserConfigurationException, SAXException, IOException {
		Student s = null;
		//得到Document
		Document doc = XMLUtil.getDocument();
		//得到所有的Student节点
		NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
		//遍历所有的student
		for(int i = 0;i<list.getLength();i++) {
			Node node = list.item(i);
			if(node.getNodeType() == Node.ELEMENT_NODE) {
				Element el = (Element)node;
				if(el.getAttribute("school_id").equals(school_id)) {
					s = new Student();
					s.setCard_id(el.getAttribute("card_id"));
					s.setAdd(el.getChildNodes().item(1).getTextContent());
					s.setName(el.getChildNodes().item(0).getTextContent());
					s.setPhone(el.getChildNodes().item(2).getTextContent());
					s.setSchool_id(school_id);
				}
			}
			
		}
		return s;
	}
	
	public boolean update(Student s) throws ParserConfigurationException, SAXException, IOException {
		boolean result = false;
		//得到Document
		Document doc = XMLUtil.getDocument();
		//得到所有的Student节点
		NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
		//遍历所有的student
		for(int i = 0;i<list.getLength();i++) {
			Node node = list.item(i);
			if(node.getNodeType() == Node.ELEMENT_NODE) {
				Element el = (Element)node;
				if(el.getAttribute("school_id").equals(s.getSchool_id())) {
					el.getChildNodes().item(0).setTextContent(s.getName());
					//此处省略...
				}
			}
			
		}
		return result;
	}
}

XMLUtil

package com.it.xmlUtil;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.xml.sax.SAXException;

public class XMLUtil {
	/**
	 * 将内存中的Document保存到磁盘上
	 * @param doc
	 * @throws TransformerException
	 */
	public static void saveXML(Document doc) throws TransformerException {
		TransformerFactory tff = TransformerFactory.newInstance();
		Transformer tf = tff.newTransformer();
		tf.transform(new DOMSource(doc), new StreamResult("resource/student.xml"));
	}
	/**
	 * 返回Document
	 * @return
	 * @throws ParserConfigurationException
	 * @throws SAXException
	 * @throws IOException
	 */
	public static Document getDocument() throws ParserConfigurationException, SAXException, IOException{
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dbf.newDocumentBuilder();
		Document doc = db.parse("resource/student.xml");
		return doc;
	}
	
}

使用SAX解析XML

package com.it.sax;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class SaxXML {
	
	public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
		//新建ContentHandler用于解析xml
		BeanHandler bh = new BeanHandler();
		SAXParser sp = SAXParserFactory.newInstance().newSAXParser();
		XMLReader xr = sp.getXMLReader();
		xr.setContentHandler(bh);
		xr.parse("resource/book.xml");
		List<Book> list = bh.getList();
		for(Book b:list) {
			System.out.println("书名" + b.getName() + "|作者" + 
					b.getAuthor() + "|价格" + b.getPrice());
		}
		
	}
	
	
}

class BeanHandler extends DefaultHandler{
	
	String currentTagName = null;
	List<Book> list = new ArrayList();
	Book book = null;
	//在遇到Element开始标签是进行的处理
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		currentTagName = qName;
		if(currentTagName.equals("书")) {
			book = new Book();
		} 
		super.startElement(uri, localName, qName, attributes);
	}
	//在遇到标题结束标志时进行的处理
	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		currentTagName = "";
		if("书".equals(qName)) {
			list.add(book);
		}
		super.endElement(uri, localName, qName);
	}
	//遇到需要处理的Textcontent时进行的处理，同时会处理换行，制表符等
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		super.characters(ch, start, length);
		if(currentTagName.equals("书名")){
			book.setName(new String(ch,start,length));
		}else if(currentTagName.equals("作者")){
			book.setAuthor(new String(ch,start,length));
		}else if(currentTagName.equals("售价")) {
			book.setPrice(new String(ch,start,length));
		}
	}

	public List<Book> getList() {
		return list;
	}
	
	
	
}

利用Dom4j解析XML

package com.itheima.dom4j;

import java.io.FileOutputStream;
import java.util.List;

import javax.xml.transform.sax.SAXResult;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Assert;
import org.junit.Test;

public class Dom4jDemo {
	//得到某个具体的节点内容
	//得到第2本书的主体内容
	@Test
	public void test1() throws Exception{
		//1、得到解析器   xpath
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		//4\得到第2本书元素
		Element book = (Element)root.elements("书").get(1);
		Element name = book.element("书名");
		Assert.assertEquals("JavaScript", name.getText());
		
	}
	@SuppressWarnings("unchecked")
	@Test
	得到第2本书的书名主体内容
	public void test11() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		String xpath = "//书[2]/书名"; //书名[2]
		Node list = document.selectSingleNode(xpath);
		Assert.assertEquals("JavaScript", list.getText());
		
	}
//	2、遍历所有元素节点,打印元素的名称
	@Test
	public void test2()throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		treeWalk(root);
	}
	public void treeWalk(Element element){
		//直接打印它的名字
		System.out.println(element.getName());
		//2、获取它的孩子Node，循环遍历
		int size = element.nodeCount();
		for(int i=0;i<size;i++){
			Node node = element.node(i);
			//判断node是否是元素
			if(node.getNodeType()==Node.ELEMENT_NODE){
				treeWalk((Element)node);
			}
		}
	}
//	3、修改某个元素节点的主体内容
	//更改第2本书的作者为wzhting
	@Test
	public void test3()throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		//4、得到第2本书的作者
		Element book = (Element)root.elements("书").get(1);
		Element author = book.element("作者");
		//5、设置其内容
		author.setText("王昭珽");
		//更新xml文档
		OutputFormat format = OutputFormat.createPrettyPrint();
//		format.setEncoding("UTF-8");//设置编码   
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"));
		//默认编码就是UTF-8
		writer.write(document);
		writer.close();
	}
//	4、向指定元素节点中增加子元素节点
	//向第1本书中增加一个新节点叫<内部价>60</内部价>
	@Test
	public void test4() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		//4、得到第1本书
		Element book = root.element("书");
		Element price = DocumentHelper.createElement("内部价");
		price.setText("60");
		book.add(price);
		OutputFormat format = OutputFormat.createPrettyPrint();
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
		//默认编码就是UTF-8
		writer.write(document);
		writer.close();
	}
//	5、向指定元素节点上增加同级元素节点
	//向第一本书的售价前面增加 批发价
	@Test
	public void test5() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		List list = root.element("书").elements();
		
		Element price = DocumentHelper.createElement("批发价");
		price.setText("10");
		
		list.add(2, price);
		
		OutputFormat format = OutputFormat.createPrettyPrint();
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
		//默认编码就是UTF-8
		writer.write(document);
		writer.close();
	}
//	6、删除指定元素节点
	//删除第2本书的作者
	@Test
	public void test6() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		//通过爸爸删自己
		Element book = (Element)root.elements("书").get(1);
		Element author = book.element("作者");
		author.getParent().remove(author);
		OutputFormat format = OutputFormat.createPrettyPrint();
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
		//默认编码就是UTF-8
		writer.write(document);
		writer.close();
	}
//	7、操作XML文件属性
	@Test
	public void test7() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		//3、获取根元素
		Element root = document.getRootElement();
		Element book = (Element)root.elements("书").get(1);
		Assert.assertEquals("传智播客", book.attributeValue("出版社"));
	}
	//8、将xml文档转换为String
	@Test
	public void test8() throws Exception{
		SAXReader reader = new SAXReader();
		//2、加载xml文档
		Document document = reader.read("src/book.xml");
		String text = document.asXML();
		System.out.println(text);
	}
	@Test
	public void test9() throws Exception{
		String text = "<person> <name>James</name> </person>";
		Document document = DocumentHelper.parseText(text);
		OutputFormat format = OutputFormat.createPrettyPrint();
		XMLWriter writer = new XMLWriter(new FileOutputStream("D:/a.xml"),format);
		//默认编码就是UTF-8
		writer.write(document);
		writer.close();
	}
}