一、什么是XML?
答:Extensible Markup Language(可扩展标记语言),它允许用户自定义标签用于描述数据;用作软件配置文件,以描述程序模块之间的关系。
二、XML语法包括以下几部分内容:
文档声明:<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
元素(element):是指文件中的标签和子标签
属性:<input name="text">
注释:<!--注释-->
CDATA区和特殊字符:<![CDATA[内容]]> 用于显示原始内容,例如显示源代码。
处理指令:简称PI,用于指挥解析引擎如何解析XML文档内容。例如xml-stylesheet指令通知引擎应用CSS文件显示xml文档内容<?xml-stylesheet type="text/css" href="1.css">
注意:
1、在XML中,空格和换行都被作为原始内容处理。
2、XML声明之前不能有注释,而且注释不能嵌套
三、XML约束
1、XML DTD(文档类型定义)
引用dtd约束<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL'>
在dtd文档中声明XML元素 <!ELEMENT 元素 元素类型>
属性定义attribute <!ATTLIST 元素名
属性名1 属性值类型 设置说明
输姓名2 属性值类型 设置说明>
设置说明:#REQUIRED必须设置该属性 #IMPLED可有可无 #PIXED固定值
四、XML解析技术
1、XML的解析方式有两种:dom(文档对象模型)和sax(Simple API for XML)
2、XML解析开发包有:Jaxp(sun开发的,由javax.xml、org.w3c.dom、org.xml.sax等包组成,其中,在javax.xml.parsers包中,定义了工厂类(如DocumentBuilderFactory),程序利用这些工厂类获取解析器从而实现XML解析)、Jdom、dom4j
3、Dom和sax解析方法的区别:
dom解析的优点是对文档的查增删改比较方便,缺点是占用内存比较大。
sax解析的优点是占用内存少,解析速度快,缺点是只适合做文档的读取,不适合做文档的查增删改。
调整jvm的大小(jvm的默认大小是64M):
byte b[ ] = new byte [1024*1024*65];当占用的内存大于64M的jvm时,通过 ”右键->run as->Run Configurations->Arguments->VM arguments空格,在这里设置大小,
用 -Xmx80m 的格式来设置。
以下是一些程序实例:
实例一:
package XML1;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
public class demo1 {
public static void main(String args[]) throws Exception {
//1、创建工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//2、得到dom解析器
DocumentBuilder builder = factory.newDocumentBuilder();
//3、解析XML文档。得到代表文档的document
Document document = builder.parse("src/book.xml");
}
}
package XML1;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
//使用dom方式对XML文档进行查增删改(crud)
public class demo2 {
@Test
public void read1() throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse("src/book.xml");
NodeList list = document.getElementsByTagName("书名");
Node node = list.item(1);
String content = node.getTextContent();
System.out.println(content);
}
//得到XML文档中的所有标签
@Test
public void read2() throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse("src/book.xml");
// 得到根结点
Node root = document.getElementsByTagName("书架").item(0);
list(root);
}
private void list(Node node) {
if (node instanceof Element) {
System.out.println(node.getNodeName());
}
NodeList list = node.getChildNodes();
for (int i = 0; i < list.getLength(); i++) {
Node node2 = list.item(i);
list(node2);
}
}
@Test
public void read3() throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse("src/book.xml");
Node bookname = document.getElementsByTagName("书名").item(0);
}
}
book.xml文档
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
<书>
<书名 name="diaosi">java网页开发</书名>
<作者>屌丝男1</作者>
<售价>18.00元</售价>
</书>
<书>
<书名>java程序开发</书名>
<作者>屌丝男2</作者>
<售价>28.00元</售价>
</书>
</书架>
book.dtd文档
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
实例二:(1)生成一个XML文件
以下是一个User实体类:
package xml;
public class User {
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAge() {
return age;
}
public void setAge(String age) {
this.age = age;
}
public String getAddress() {
return address;
}
public void setAddress(String address) {
this.address = address;
}
public String getPhone() {
return phone;
}
public void setPhone(String phone) {
this.phone = phone;
}
@Override
public String toString() {
return "User [address=" + address + ", age=" + age + ", id=" + id
+ ", name=" + name + ", phone=" + phone + "]";
}
private String id;
private String name;
private String age;
private String address;
private String phone;
}
package xml;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
public class UserToXml {
static List<User> list=new ArrayList<User>();
public UserToXml(){
for (int i = 1; i <= 10; i++) {
User user=new User();
user.setId(i+"");
user.setName("admin"+i);
user.setAge(""+i);
user.setAddress("五山路"+i+"号");
user.setPhone("10086"+i);
list.add(user);
}
}
//生成XML文档
public Document getDocument(){
//第一步,创建Document
Document document=DocumentHelper.createDocument();
//第二步,创建根节点
Element root=document.addElement("Users");
//第三步,创建子节点
User user1=null;
for (int i = 0; i < list.size(); i++) {
user1=list.get(i);
//创建User节点
Element user=root.addElement("user");
//设置节点的属性
user.addAttribute("id", user1.getId());
//创建user节点下的节点
Element name=user.addElement("name");
name.addText(user1.getName());
Element age=user.addElement("age");
age.addText(user1.getAge());
Element address=user.addElement("address");
address.addText(user1.getAddress());
Element phone=user.addElement("phone");
phone.addText(user1.getPhone());
}
return document;
}
public void testOut(Document doc,String file){
try {
FileWriter fileWriter=new FileWriter(file);
//设置xml文档的格式
OutputFormat xmlF=new OutputFormat();
xmlF.setEncoding("GBK");
//创建写入流
XMLWriter xmlw=new XMLWriter(fileWriter,xmlF);
xmlw.write(doc);
xmlw.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static void main(String[] args) {
UserToXml xml=new UserToXml();
xml.testOut(xml.getDocument(), "user.xml");
}
}
(2)读取XML文件
<?xml version="1.0" encoding="UTF-8"?>
<单据>
<收款凭证 编号="HN1310121130539">
<付款方 班级="10软件"> 张三 </付款方>
<收款人>彰武</收款人>
<收费时间>2013-10-12</收费时间>
<缴费项目>
<项目 编号="1">
<名称>教材费</名称>
<value>100.00</value>
</项目>
<项目 编号="2">
<名称>报考费</名称>
<value>190.00</value>
</项目>
<项目 编号="3">
<名称>学费</名称>
<value>320.00</value>
</项目>
</缴费项目>
<备注>dasdasffdbggggggggggggggggggggd</备注>
</收款凭证>
<收款凭证 编号="HN1310121130549">
<付款方 班级="10软件">张四</付款方>
<收款人>彰武</收款人>
<收费时间>2013-10-13</收费时间>
<缴费项目>
<项目 编号="1">
<名称>教材费</名称>
<value>130.00</value>
</项目>
<项目 编号="2">
<名称>报考费</名称>
<value>140.00</value>
</项目>
<项目 编号="3">
<名称>学费</名称>
<value>1320.00</value>
</项目>
</缴费项目>
<备注>阿三获得更好的方法和开发</备注>
</收款凭证>
<税务凭证>
</税务凭证>
</单据>
缴费项目中的属性的实体类:
package xml;
public class PayItem {
public String getPid() {
return pid;
}
public void setPid(String pid) {
this.pid = pid;
}
public String getPname() {
return name;
}
public void setPname(String name) {
this.name = name;
}
public double getPaym() {
return paym;
}
public void setPaym(double paym) {
this.paym = paym;
}
@Override
public String toString() {
return "PayItem [paym=" + paym + ", pid=" + pid + ", name=" + name
+ "]";
}
private String pid;
private String name;
private double paym;
}
package xml;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
public class DanJu {
private String id;
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getPname() {
return pname;
}
public void setPname(String pname) {
this.pname = pname;
}
public String getEmp() {
return emp;
}
public void setEmp(String emp) {
this.emp = emp;
}
public Date getPayDate() {
return payDate;
}
public void setPayDate(Date payDate) {
this.payDate = payDate;
}
public String getCz() {
return cz;
}
public void setCz(String cz) {
this.cz = cz;
}
public List<PayItem> getList() {
return list;
}
public void setList(List<PayItem> list) {
this.list = list;
}
public String getDesc() {
return desc;
}
public void setDesc(String desc) {
this.desc = desc;
}
@Override
public String toString() {
return "DanJu [cz=" + cz + ", desc=" + desc + ", emp=" + emp + ", id="
+ id + ", list=" + list + ", pname=" + pname + ", payDate="
+ payDate + "]";
}
private String pname;
private String emp;
private Date payDate;
private String cz;
private List<PayItem> list = new ArrayList<PayItem>();
private String desc;
}
</pre><pre name="code" class="java">
以下是使用SAX解析方式读取XML文件中的内容:
(<span style="font-family: Arial, Helvetica, sans-serif;">Document doc=new SAXReader().read(file);</span>)
</pre><pre name="code" class="java">package xml;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Dom4JSax {
SimpleDateFormat stm=new SimpleDateFormat("yyyy-MM-dd");
public List<DanJu> parseDj(String file){
//创建返回类型对象
List<DanJu> list=new ArrayList<DanJu>();
//从xml文本中读取xml文档
try {
Document doc=new SAXReader().read(file);
//解析XML节点
Element root=doc.getRootElement();
//将“收款凭证”读到List集合中
List<Element> skzp=root.elements("收款凭证");
//定义变量
DanJu dj=null;
for(Element pz:skzp){
dj=new DanJu();
dj.setId(pz.attributeValue("编号"));
//获取付款方
Element fk=pz.element("付款方");
dj.setPname(fk.getText());
dj.setCz(fk.attributeValue("班级"));
//获取收款人
dj.setEmp(pz.elementText("收款人"));
//获取收款时间
dj.setPayDate(stm.parse(pz.elementText("收费时间")));
//获取取款项目
List<Element> items = pz.element("缴费项目").elements();
PayItem pay=null;
//创建一个明细
for(Element payitem:items){
pay=new PayItem();
pay.setPid(payitem.attributeValue("编号"));
pay.setPname(payitem.elementText("名称"));
pay.setPaym(Double.parseDouble(payitem.elementText("value")));
dj.getList().add(pay);
}
dj.setDesc(pz.elementText("备注"));
list.add(dj);
}
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (ParseException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return list;
}
public static void main(String[] args) {
Dom4JSax s=new Dom4JSax();
System.out.println(s.parseDj("myTest.xml"));
}
}
五、XML更新
1、javax.xml.transformer包中的Transformer类用于把代表XML文档中的Document对象转换成某种格式后进行输出,例如把XML文件应用样式表后转成一个HTML文件。利用这个对象,当然也可以把Document对象又重新写入到一个XML文件中
Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们通过:
javax.xml.transform.dom.DOMSource类来关联要转换的document对象;
javax.xml.transform.stream.StreamResult对象来表示数据的目的地;
Transformer对象通过TransformerFactory获得。