XML笔记

最新推荐文章于 2022-02-25 10:13:32 发布

dld孤独的浪子

最新推荐文章于 2022-02-25 10:13:32 发布

阅读量359

点赞数

分类专栏： java

本文链接：https://blog.csdn.net/u013234938/article/details/38356859

版权

java 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、什么是XML？

答：Extensible Markup Language（可扩展标记语言），它允许用户自定义标签用于描述数据；用作软件配置文件，以描述程序模块之间的关系。

二、XML语法包括以下几部分内容：

文档声明：<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>

元素（element）:是指文件中的标签和子标签

属性：<input name="text">

注释:

CDATA区和特殊字符：<![CDATA[内容]]> 用于显示原始内容，例如显示源代码。

处理指令：简称PI，用于指挥解析引擎如何解析XML文档内容。例如xml-stylesheet指令通知引擎应用CSS文件显示xml文档内容<?xml-stylesheet type="text/css" href="1.css">

注意：

1、在XML中，空格和换行都被作为原始内容处理。

2、XML声明之前不能有注释，而且注释不能嵌套

三、XML约束

1、XML DTD（文档类型定义）

引用dtd约束<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL'>

在dtd文档中声明XML元素 <!ELEMENT 元素元素类型>

属性定义attribute <!ATTLIST 元素名

属性名1 属性值类型设置说明

输姓名2 属性值类型设置说明>

设置说明：#REQUIRED必须设置该属性 #IMPLED可有可无 #PIXED固定值

四、XML解析技术

1、XML的解析方式有两种：dom(文档对象模型)和sax（Simple API for XML）

2、XML解析开发包有：Jaxp(sun开发的，由javax.xml、org.w3c.dom、org.xml.sax等包组成，其中，在javax.xml.parsers包中，定义了工厂类（如DocumentBuilderFactory），程序利用这些工厂类获取解析器从而实现XML解析)、Jdom、dom4j

3、Dom和sax解析方法的区别：

dom解析的优点是对文档的查增删改比较方便，缺点是占用内存比较大。

sax解析的优点是占用内存少，解析速度快，缺点是只适合做文档的读取，不适合做文档的查增删改。

调整jvm的大小(jvm的默认大小是64M)：

byte b[ ] = new byte [1024*1024*65];当占用的内存大于64M的jvm时，通过 ”右键->run as->Run Configurations->Arguments->VM arguments空格，在这里设置大小，

用 -Xmx80m 的格式来设置。

以下是一些程序实例：

实例一：

package XML1;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;

public class demo1 {
	public static void main(String args[]) throws Exception {
	
		//1、创建工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		
		//2、得到dom解析器
		DocumentBuilder builder = factory.newDocumentBuilder();
		
		//3、解析XML文档。得到代表文档的document
		Document document = builder.parse("src/book.xml");
}
}

package XML1;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

//使用dom方式对XML文档进行查增删改（crud)
public class demo2 {

	@Test
	public void read1() throws Exception {
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = factory.newDocumentBuilder();
		Document document = builder.parse("src/book.xml");

		NodeList list = document.getElementsByTagName("书名");
		Node node = list.item(1);
		String content = node.getTextContent();
		System.out.println(content);
	}

	//得到XML文档中的所有标签
	@Test
	public void read2() throws Exception {
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = factory.newDocumentBuilder();
		Document document = builder.parse("src/book.xml");

		// 得到根结点
		Node root = document.getElementsByTagName("书架").item(0);

		list(root);

	}

	private void list(Node node) {
		if (node instanceof Element) {
			System.out.println(node.getNodeName());
		}
		NodeList list = node.getChildNodes();
		for (int i = 0; i < list.getLength(); i++) {
			Node node2 = list.item(i);
			list(node2);
		}

	}
	@Test
	public void read3() throws Exception {
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = factory.newDocumentBuilder();
		Document document = builder.parse("src/book.xml");

		Node bookname = document.getElementsByTagName("书名").item(0);
		
	}
}

book.xml文档

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
	<书>
		<书名 name="diaosi">java网页开发</书名>
		<作者>屌丝男1</作者>
		<售价>18.00元</售价>
	</书>
	<书>
		<书名>java程序开发</书名>
		<作者>屌丝男2</作者>
		<售价>28.00元</售价>
	</书>
</书架>

book.dtd文档

<!ELEMENT 书架 (书+)>
	<!ELEMENT 书 (书名,作者,售价)>
	<!ELEMENT 书名 (#PCDATA)>
	<!ELEMENT 作者 (#PCDATA)>
	<!ELEMENT 售价 (#PCDATA)>

实例二：（1）生成一个XML文件

以下是一个User实体类:

package xml;

public class User {

	
	public String getId() {
		return id;
	}
	public void setId(String id) {
		this.id = id;
	}
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
	public String getAge() {
		return age;
	}
	public void setAge(String age) {
		this.age = age;
	}
	public String getAddress() {
		return address;
	}
	public void setAddress(String address) {
		this.address = address;
	}
	public String getPhone() {
		return phone;
	}
	public void setPhone(String phone) {
		this.phone = phone;
	}
	
	
	@Override
	public String toString() {
		return "User [address=" + address + ", age=" + age + ", id=" + id
				+ ", name=" + name + ", phone=" + phone + "]";
	}

	private String id;
	private String name;
	private String age;
	private String address;
	private String phone;
}

package xml;

import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;


public class UserToXml {

	static List<User> list=new ArrayList<User>();
	
	public UserToXml(){
		
		for (int i = 1; i <= 10; i++) {
			User user=new User();
			user.setId(i+"");
			user.setName("admin"+i);
			user.setAge(""+i);
			user.setAddress("五山路"+i+"号");
			user.setPhone("10086"+i);
			list.add(user);
			
		}
	}

	//生成XML文档
	public Document getDocument(){
		//第一步，创建Document
		Document document=DocumentHelper.createDocument();
		//第二步，创建根节点
		Element root=document.addElement("Users");
		//第三步，创建子节点
		User user1=null;
		for (int i = 0; i < list.size(); i++) {
			user1=list.get(i);
			//创建User节点
			Element user=root.addElement("user");
			//设置节点的属性
			user.addAttribute("id", user1.getId());
			//创建user节点下的节点
			Element name=user.addElement("name");
			name.addText(user1.getName());
			
			Element age=user.addElement("age");
			age.addText(user1.getAge());
			
			Element address=user.addElement("address");
			address.addText(user1.getAddress());
			
			Element phone=user.addElement("phone");
			phone.addText(user1.getPhone());
		}
		return document;
		
	}
	
	public void testOut(Document doc,String file){
		
		try {
			FileWriter fileWriter=new FileWriter(file);
			//设置xml文档的格式
			OutputFormat xmlF=new OutputFormat();
			xmlF.setEncoding("GBK");
			
			//创建写入流
			XMLWriter xmlw=new XMLWriter(fileWriter,xmlF);
			xmlw.write(doc);
			xmlw.close();
		
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
	}
	public static void main(String[] args) {
		UserToXml xml=new UserToXml();
		xml.testOut(xml.getDocument(), "user.xml");
		
	}
}

（2）读取XML文件

<?xml version="1.0" encoding="UTF-8"?>
<单据>
	<收款凭证 编号="HN1310121130539">
		<付款方 班级="10软件"> 张三   </付款方>
		<收款人>彰武</收款人>
		<收费时间>2013-10-12</收费时间>
		<缴费项目>
            <项目 编号="1">
              <名称>教材费</名称>
              <value>100.00</value>
            </项目>
            
            <项目 编号="2">
              <名称>报考费</名称>
              <value>190.00</value>
            </项目>
            
            <项目 编号="3">
              <名称>学费</名称>
              <value>320.00</value>
            </项目>
            
		</缴费项目>
        <备注>dasdasffdbggggggggggggggggggggd</备注>
	</收款凭证>
	
	
	<收款凭证 编号="HN1310121130549">
		<付款方 班级="10软件">张四</付款方>
		<收款人>彰武</收款人>
		<收费时间>2013-10-13</收费时间>
		<缴费项目>
            <项目 编号="1">
              <名称>教材费</名称>
              <value>130.00</value>
            </项目>
            <项目 编号="2">
              <名称>报考费</名称>
              <value>140.00</value>
            </项目>
            <项目 编号="3">
              <名称>学费</名称>
              <value>1320.00</value>
            </项目>
		</缴费项目>
        <备注>阿三获得更好的方法和开发</备注>
	</收款凭证>

    <税务凭证>
    </税务凭证>    
</单据>

缴费项目中的属性的实体类：

package xml;

public class PayItem {

	public String getPid() {
		return pid;
	}

	public void setPid(String pid) {
		this.pid = pid;
	}

	public String getPname() {
		return name;
	}

	public void setPname(String name) {
		this.name = name;
	}

	public double getPaym() {
		return paym;
	}

	public void setPaym(double paym) {
		this.paym = paym;
	}

	@Override
	public String toString() {
		return "PayItem [paym=" + paym + ", pid=" + pid + ", name=" + name
				+ "]";
	}

	private String pid;
	private String name;
	private double paym;
}

整个单据的实体类：

package xml;

import java.util.ArrayList;
import java.util.Date;
import java.util.List;

public class DanJu {

	private String id;

	public String getId() {
		return id;
	}

	public void setId(String id) {
		this.id = id;
	}

	public String getPname() {
		return pname;
	}

	public void setPname(String pname) {
		this.pname = pname;
	}

	public String getEmp() {
		return emp;
	}

	public void setEmp(String emp) {
		this.emp = emp;
	}

	public Date getPayDate() {
		return payDate;
	}

	public void setPayDate(Date payDate) {
		this.payDate = payDate;
	}

	public String getCz() {
		return cz;
	}

	public void setCz(String cz) {
		this.cz = cz;
	}

	public List<PayItem> getList() {
		return list;
	}

	public void setList(List<PayItem> list) {
		this.list = list;
	}

	public String getDesc() {
		return desc;
	}

	public void setDesc(String desc) {
		this.desc = desc;
	}

	@Override
	public String toString() {
		return "DanJu [cz=" + cz + ", desc=" + desc + ", emp=" + emp + ", id="
				+ id + ", list=" + list + ", pname=" + pname + ", payDate="
				+ payDate + "]";
	}

	private String pname;
	private String emp;
	private Date payDate;
	private String cz;
	private List<PayItem> list = new ArrayList<PayItem>();
	private String desc;
}

</pre><pre name="code" class="java">

以下是使用SAX解析方式读取XML文件中的内容：

（<span style="font-family: Arial, Helvetica, sans-serif;">Document doc=new SAXReader().read(file);</span>）

</pre><pre name="code" class="java">package xml;

import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Dom4JSax {

	SimpleDateFormat stm=new SimpleDateFormat("yyyy-MM-dd");
	
	public List<DanJu> parseDj(String file){

		//创建返回类型对象
		List<DanJu> list=new ArrayList<DanJu>();
		
		//从xml文本中读取xml文档
		try {
			Document doc=new SAXReader().read(file);
		
			//解析XML节点
			Element root=doc.getRootElement();
			//将“收款凭证”读到List集合中
			List<Element> skzp=root.elements("收款凭证");
			
			//定义变量
			DanJu dj=null;
			for(Element pz:skzp){
				dj=new DanJu();
				
				dj.setId(pz.attributeValue("编号"));
				
				//获取付款方
				Element fk=pz.element("付款方");
				dj.setPname(fk.getText());
				
				dj.setCz(fk.attributeValue("班级"));
				
				//获取收款人
				dj.setEmp(pz.elementText("收款人"));
				
				//获取收款时间
				dj.setPayDate(stm.parse(pz.elementText("收费时间")));
			
				//获取取款项目
				List<Element> items = pz.element("缴费项目").elements();
				
				PayItem pay=null;
				
				//创建一个明细
				for(Element payitem:items){
					pay=new PayItem();
					
					pay.setPid(payitem.attributeValue("编号"));
					pay.setPname(payitem.elementText("名称"));
					pay.setPaym(Double.parseDouble(payitem.elementText("value")));
					
					dj.getList().add(pay);
				}
				dj.setDesc(pz.elementText("备注"));
				
				list.add(dj);
			}
			
		} catch (DocumentException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (ParseException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
		return list;
	}
	
	
	public static void main(String[] args) {
		Dom4JSax s=new Dom4JSax();
		System.out.println(s.parseDj("myTest.xml"));
	}
}

五、XML更新

1、javax.xml.transformer包中的Transformer类用于把代表XML文档中的Document对象转换成某种格式后进行输出，例如把XML文件应用样式表后转成一个HTML文件。利用这个对象，当然也可以把Document对象又重新写入到一个XML文件中

Transformer类通过transform方法完成转换操作，该方法接收一个源和一个目的地。我们通过：

javax.xml.transform.dom.DOMSource类来关联要转换的document对象；

javax.xml.transform.stream.StreamResult对象来表示数据的目的地；

Transformer对象通过TransformerFactory获得。