一、XML概述
1、XML是可扩展标记语言。是由W3C指定并维护的,目前最新的版本是1.0
2、XML作用:
2.1传输数据,它是一种通用的数据交换格式
2.2配置文件。
二、xml语法
1、XML的声明
1.1语法:<?xml version="1.0" encoding="UTF-8"?>
保存在磁盘上的文件编码要与声明的编码一致。
encoding属性的默认 编码是:UTF-8
1.2XML的声明必须出现在XML文档的第一行
2、XML的注释
2.1语法:<!--这是注释-->
2.2注释不能出现在声明之前
3、CDATA区
CDATA是Character Data的缩写
把标签当做普通文本内容;
示例:
<![CDATA[
<itcast>www.itcast.cn</itcast>
]]>
三、DTD约束
1、常用约束:DTD(Document Type Definition)文档类型定义
Schema
2、格式良好的XML:遵循XML语法的文档
有效的XML:遵守约束的文档。
有效的XML文档一定是格式良好的,但格式良好的不一定是有效的
3、单独的DTD文档在保存时要以UTF-8编码进行保存
4、编写DTD
4.1在XML文档中直接编写:
<?xml version="1.0" encoding="gbk"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架/>
4.2引入外部DTD
4.2.1:当引用的DTD文档在本地时,采用如下方式:
<!DOCTYPE 根元素 SYSTEM “DTD文档路径”>
4.2.2:当引用的DTD文档在公共网络上时,采用如下方式:
<!DOCTYPE 根元素 PUBLIC “DTD名称” “DTD文档的URL”>
5、定义元素:
语法:<!ELEMENT 元素名称 使用规则>
使用规则:
(#PCDATA):表示标签主体内容为普通字符串
EMPTY:表示标签没有主体内容
ANY:主体为任意内容
(子元素):标签中的子元素
用逗号分开:按顺序出现
用“|”:选择其中一个
出现次数:
如果元素后面没有+*?:表示必须且只能出现一次
+:表示至少出现一次,一次或多次
*:表示可有可无,零次、一次或多次
?:表示可以有也可以无,有的话只能有一次。零次或一次
6、定义元素的属性
语法:<!ATTLIST 元素名称
属性名称1 属性值类型 设置说明
属性名称2 属性值类型 设置说明
....
>
属性值类型:
CDATA:普通文本数据
A|B|C "A":表示枚举值,只能从A、B、C中取其中一个,A为默认值
ID:表示取值不能重复
设置说明:
#REQUIRED:表示该属性必须出现
#IMPLIED:表示该属性可有可无
#FIXED:表示属性的取值为一个固定值。语法:#FIXED "固定值"
XMLUtil
1、XML是可扩展标记语言。是由W3C指定并维护的,目前最新的版本是1.0
2、XML作用:
2.1传输数据,它是一种通用的数据交换格式
2.2配置文件。
二、xml语法
1、XML的声明
1.1语法:<?xml version="1.0" encoding="UTF-8"?>
保存在磁盘上的文件编码要与声明的编码一致。
encoding属性的默认 编码是:UTF-8
1.2XML的声明必须出现在XML文档的第一行
2、XML的注释
2.1语法:<!--这是注释-->
2.2注释不能出现在声明之前
3、CDATA区
CDATA是Character Data的缩写
把标签当做普通文本内容;
示例:
<![CDATA[
<itcast>www.itcast.cn</itcast>
]]>
三、DTD约束
1、常用约束:DTD(Document Type Definition)文档类型定义
Schema
2、格式良好的XML:遵循XML语法的文档
有效的XML:遵守约束的文档。
有效的XML文档一定是格式良好的,但格式良好的不一定是有效的
3、单独的DTD文档在保存时要以UTF-8编码进行保存
4、编写DTD
4.1在XML文档中直接编写:
<?xml version="1.0" encoding="gbk"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架/>
4.2引入外部DTD
4.2.1:当引用的DTD文档在本地时,采用如下方式:
<!DOCTYPE 根元素 SYSTEM “DTD文档路径”>
4.2.2:当引用的DTD文档在公共网络上时,采用如下方式:
<!DOCTYPE 根元素 PUBLIC “DTD名称” “DTD文档的URL”>
5、定义元素:
语法:<!ELEMENT 元素名称 使用规则>
使用规则:
(#PCDATA):表示标签主体内容为普通字符串
EMPTY:表示标签没有主体内容
ANY:主体为任意内容
(子元素):标签中的子元素
用逗号分开:按顺序出现
用“|”:选择其中一个
出现次数:
如果元素后面没有+*?:表示必须且只能出现一次
+:表示至少出现一次,一次或多次
*:表示可有可无,零次、一次或多次
?:表示可以有也可以无,有的话只能有一次。零次或一次
6、定义元素的属性
语法:<!ATTLIST 元素名称
属性名称1 属性值类型 设置说明
属性名称2 属性值类型 设置说明
....
>
属性值类型:
CDATA:普通文本数据
A|B|C "A":表示枚举值,只能从A、B、C中取其中一个,A为默认值
ID:表示取值不能重复
设置说明:
#REQUIRED:表示该属性必须出现
#IMPLIED:表示该属性可有可无
#FIXED:表示属性的取值为一个固定值。语法:#FIXED "固定值"
直接值:表示属性的取值为该默认值
StudentDao:
package com.it.dao;
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.TransformerException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import com.it.model.Student;
import com.it.xmlUtil.XMLUtil;
public class StudentDao {
public void add(Student s) throws ParserConfigurationException, SAXException, IOException, TransformerException {
//得到Document对象
Document doc = XMLUtil.getDocument();
//构建Student相关的所有Element
Element e_student = doc.createElement("student");
e_student.setAttribute("school_id", s.getSchool_id());
e_student.setAttribute("card_id", s.getCard_id());
Element e_name = doc.createElement("name");
e_name.setTextContent(s.getName());
Element e_add = doc.createElement("add");
e_add.setTextContent(s.getAdd());
Element e_phone = doc.createElement("phone");
e_phone.setTextContent(s.getPhone());
//建立Element之间的关系
e_student.appendChild(e_name);
e_student.appendChild(e_add);
e_student.appendChild(e_phone);
doc.getElementsByTagName("exam").item(0).appendChild(e_student);
//将添加了学生的Element保存
XMLUtil.saveXML(doc);
}
public boolean delete(String school_id) throws ParserConfigurationException, SAXException, IOException, TransformerException {
boolean result = false;
//得到Document
Document doc = XMLUtil.getDocument();
//得到所有的Student节点
NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
//遍历所有的student
for(int i = 0;i<list.getLength();i++) {
Node node = list.item(i);
if(node.getNodeType() == Node.ELEMENT_NODE) {
Element el = (Element)node;
//找到需要删除的节点,用他的父节点删除之
if(el.getAttribute("school_id").equals(school_id)) {
node.getParentNode().removeChild(node);
result = true;
}
}
}
XMLUtil.saveXML(doc);
return result;
}
public Student search(String school_id) throws ParserConfigurationException, SAXException, IOException {
Student s = null;
//得到Document
Document doc = XMLUtil.getDocument();
//得到所有的Student节点
NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
//遍历所有的student
for(int i = 0;i<list.getLength();i++) {
Node node = list.item(i);
if(node.getNodeType() == Node.ELEMENT_NODE) {
Element el = (Element)node;
if(el.getAttribute("school_id").equals(school_id)) {
s = new Student();
s.setCard_id(el.getAttribute("card_id"));
s.setAdd(el.getChildNodes().item(1).getTextContent());
s.setName(el.getChildNodes().item(0).getTextContent());
s.setPhone(el.getChildNodes().item(2).getTextContent());
s.setSchool_id(school_id);
}
}
}
return s;
}
public boolean update(Student s) throws ParserConfigurationException, SAXException, IOException {
boolean result = false;
//得到Document
Document doc = XMLUtil.getDocument();
//得到所有的Student节点
NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
//遍历所有的student
for(int i = 0;i<list.getLength();i++) {
Node node = list.item(i);
if(node.getNodeType() == Node.ELEMENT_NODE) {
Element el = (Element)node;
if(el.getAttribute("school_id").equals(s.getSchool_id())) {
el.getChildNodes().item(0).setTextContent(s.getName());
//此处省略...
}
}
}
return result;
}
}
XMLUtil
package com.it.xmlUtil;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.xml.sax.SAXException;
public class XMLUtil {
/**
* 将内存中的Document保存到磁盘上
* @param doc
* @throws TransformerException
*/
public static void saveXML(Document doc) throws TransformerException {
TransformerFactory tff = TransformerFactory.newInstance();
Transformer tf = tff.newTransformer();
tf.transform(new DOMSource(doc), new StreamResult("resource/student.xml"));
}
/**
* 返回Document
* @return
* @throws ParserConfigurationException
* @throws SAXException
* @throws IOException
*/
public static Document getDocument() throws ParserConfigurationException, SAXException, IOException{
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse("resource/student.xml");
return doc;
}
}
使用SAX解析XML
package com.it.sax;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class SaxXML {
public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
//新建ContentHandler用于解析xml
BeanHandler bh = new BeanHandler();
SAXParser sp = SAXParserFactory.newInstance().newSAXParser();
XMLReader xr = sp.getXMLReader();
xr.setContentHandler(bh);
xr.parse("resource/book.xml");
List<Book> list = bh.getList();
for(Book b:list) {
System.out.println("书名" + b.getName() + "|作者" +
b.getAuthor() + "|价格" + b.getPrice());
}
}
}
class BeanHandler extends DefaultHandler{
String currentTagName = null;
List<Book> list = new ArrayList();
Book book = null;
//在遇到Element开始标签是进行的处理
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
currentTagName = qName;
if(currentTagName.equals("书")) {
book = new Book();
}
super.startElement(uri, localName, qName, attributes);
}
//在遇到标题结束标志时进行的处理
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
currentTagName = "";
if("书".equals(qName)) {
list.add(book);
}
super.endElement(uri, localName, qName);
}
//遇到需要处理的Textcontent时进行的处理,同时会处理换行,制表符等
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
super.characters(ch, start, length);
if(currentTagName.equals("书名")){
book.setName(new String(ch,start,length));
}else if(currentTagName.equals("作者")){
book.setAuthor(new String(ch,start,length));
}else if(currentTagName.equals("售价")) {
book.setPrice(new String(ch,start,length));
}
}
public List<Book> getList() {
return list;
}
}
利用Dom4j解析XML
package com.itheima.dom4j;
import java.io.FileOutputStream;
import java.util.List;
import javax.xml.transform.sax.SAXResult;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Assert;
import org.junit.Test;
public class Dom4jDemo {
//得到某个具体的节点内容
//得到第2本书的主体内容
@Test
public void test1() throws Exception{
//1、得到解析器 xpath
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
//4\得到第2本书元素
Element book = (Element)root.elements("书").get(1);
Element name = book.element("书名");
Assert.assertEquals("JavaScript", name.getText());
}
@SuppressWarnings("unchecked")
@Test
得到第2本书的书名主体内容
public void test11() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
String xpath = "//书[2]/书名"; //书名[2]
Node list = document.selectSingleNode(xpath);
Assert.assertEquals("JavaScript", list.getText());
}
// 2、遍历所有元素节点,打印元素的名称
@Test
public void test2()throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
treeWalk(root);
}
public void treeWalk(Element element){
//直接打印它的名字
System.out.println(element.getName());
//2、获取它的孩子Node,循环遍历
int size = element.nodeCount();
for(int i=0;i<size;i++){
Node node = element.node(i);
//判断node是否是元素
if(node.getNodeType()==Node.ELEMENT_NODE){
treeWalk((Element)node);
}
}
}
// 3、修改某个元素节点的主体内容
//更改第2本书的作者为wzhting
@Test
public void test3()throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
//4、得到第2本书的作者
Element book = (Element)root.elements("书").get(1);
Element author = book.element("作者");
//5、设置其内容
author.setText("王昭珽");
//更新xml文档
OutputFormat format = OutputFormat.createPrettyPrint();
// format.setEncoding("UTF-8");//设置编码
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"));
//默认编码就是UTF-8
writer.write(document);
writer.close();
}
// 4、向指定元素节点中增加子元素节点
//向第1本书中增加一个新节点叫<内部价>60</内部价>
@Test
public void test4() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
//4、得到第1本书
Element book = root.element("书");
Element price = DocumentHelper.createElement("内部价");
price.setText("60");
book.add(price);
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
//默认编码就是UTF-8
writer.write(document);
writer.close();
}
// 5、向指定元素节点上增加同级元素节点
//向第一本书的售价前面增加 批发价
@Test
public void test5() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
List list = root.element("书").elements();
Element price = DocumentHelper.createElement("批发价");
price.setText("10");
list.add(2, price);
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
//默认编码就是UTF-8
writer.write(document);
writer.close();
}
// 6、删除指定元素节点
//删除第2本书的作者
@Test
public void test6() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
//通过爸爸删自己
Element book = (Element)root.elements("书").get(1);
Element author = book.element("作者");
author.getParent().remove(author);
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
//默认编码就是UTF-8
writer.write(document);
writer.close();
}
// 7、操作XML文件属性
@Test
public void test7() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
//3、获取根元素
Element root = document.getRootElement();
Element book = (Element)root.elements("书").get(1);
Assert.assertEquals("传智播客", book.attributeValue("出版社"));
}
//8、将xml文档转换为String
@Test
public void test8() throws Exception{
SAXReader reader = new SAXReader();
//2、加载xml文档
Document document = reader.read("src/book.xml");
String text = document.asXML();
System.out.println(text);
}
@Test
public void test9() throws Exception{
String text = "<person> <name>James</name> </person>";
Document document = DocumentHelper.parseText(text);
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("D:/a.xml"),format);
//默认编码就是UTF-8
writer.write(document);
writer.close();
}
}