JavaWeb开发 详解XML
1.XML简介
XML是可扩展(所谓可扩展就是程序员自己可以定义)的标记性语言。
-
XML的主要作用如下:
-
1.用来保存数据。而且这些数据具有自我描述性。
-
2.它还可以作为项目或者模块的配置文件。
-
3.还可以作为网络传输数据的格式。(现在以JSON为主)。
2.XML语法
2.1 文档说明
xml可以用来保存数据。下面我们来体验下,创建一个xml文件,用来描述图书信息。
步骤(1)创建一个xml文件
文件名:
步骤(2):编写xml文件。
注意:图书有出版号sn 表示唯一标识,书名,作者,价格的信息。
<?xml version="1.0" encoding="utf-8" ?>
<!--
<?xml version="1.0" encoding="utf-8" ?>
以上内容是xml文件的声明
version="1.0" version表示xml的版本
encoding="utf-8" encoding表示xml文件本身的编码
-->
<books><!--books 表示多个图书信息-->
<book sn="1234"> <!--book 表示一个图书信息 sn属性表示图书序列号-->
<name>java从入门到放弃</name> <!--name标签 表示书名-->
<author>Sun</author> <!--author标签 表示作者-->
<price>300</price> <!--prcie标签 表示价格-->
</book>
<book sn="12345"> <!--book 表示一个图书信息 sn属性表示图书序列号-->
<name>数据库原理</name> <!--name标签 表示书名-->
<author>张三</author> <!--author标签 表示作者-->
<price>100</price> <!--prcie标签 表示价格-->
</book>
</books>
此xml文件也可以在浏览器中进行查看。
2.2 xml中的元素(标签)
2.2.1 xml中元素的理解
首先,来说明下XML元素的含义。XML元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他元素、文本或者两者的混合。元素也可以拥有属性。
2.2.2 XML中的命名规则
XML中的命名规则 |
---|
名称可以含字母、数字以及其他字符 |
名称不能以数字或者标点符号开始 |
名称不能包含空格 |
名称可以包含字母、数字以及其他的字符
<book sn="SN12341232">
<name>辟邪剑谱</name>
<price>9.9</price>
<author>班主任</author>
</book>
名称不能以数字或者标点符号开头
名称不能包含空格
注意:XML中的元素(标签)也分为单标签和双标签:
单标签:
格式:<标签名 属性1=’'值" 属性2=“值” …/>
双标签:
格式:<标签名 属性1=“值” 属性2=“值”…>文本数据或子标签</标签名>
2.3 xml属性
xml的标签属性和html的标签属性是非常类似的,属性可以提供元素的额外信息。
- xml文件中一个标签上可以书写多个属性,每个属性必须使用引号引起来。
属性必须使用引号引起来,不引会报错
2.4 xml中的语法规则
(1) 所有的xml标签都必须关闭标签(闭合标签)
(2) xml标签对大小写敏感
(3) xml必须正确地进行嵌套
(4) xml文档中必须有根元素
根元素就是顶级元素。没有父标签的元素就是顶级元素。根元素是没有父标签的顶级元素,而且是唯一一个。
(5) xml中的特殊字符
3.xml解析技术
xml可扩展的标记语言。不管是html文件还是xml文件,它们都是标记型文档,都可以使用w3c组织制定的dom技术来解析。
document对象表示整个文档(可以是html文档,也可以是xml文档)。
早期 JDK 为我们提供了两种 xml 解析技术 DOM 和 Sax 简介。
dom解析技术是W3C组织制定的,而所有的编程语言都对这个解析技术使用自己语言的特点进行实现。Java对dom技术解析标记做了实现。
sun公司在JDK5版本对dom解析技术进行升级:SAX(Simple API for XML)。SAX解析,与W3C制定的解析不太一样,它是以类似事件机制通过回调告诉用户当前正在解析的内容。它是一行一行的读取xml文件进行解析的,不会创建大量的dom对象。
第三方的解析:
- jdom在dom基础上进行了封装
- dom4j又对jdom进行了封装
dom4j是第三方的解析技术,可以使用第三方给我们提供好的类库才可以解析xml文件。
4.dom4j解析技术
由于dom4j属于第三方公司的技术,我们需要使用dom4j,就需要到dom4j官网上进行下载dom4j的jar包。
4.1 dom4j类库使用
将dom4j官网上下载的dom4j的压缩包进行解压。
4.2 dom4j目录的介绍
(1)dom4j是文档目录
(2)如何查dom4j的文档
(3)lib目录
(4)src目录是第三方类库的源码目录:
4.3 dom4j编码步骤
dom4j编码步骤:
- 第一步:先加载xml文件创建Document对象。
- 第二步:通过Document对象拿到根元素对象。
- 第三步:通过根元素.elements(标签名);可以返回一个集合,这个集合里面放着所有指定的标签名的元素对象。
- 找到想要修改、删除的子元素,进行相应的操作。
- 保存在硬盘上。
4.4 获取document对象
创建一个lib目录,并添加dom4j的jar包,并添加到类路径上。
需要解析的books.xml文件内容
<?xml version="1.0" encoding="UTF-8"?>
<books>
<book sn="SN12341232">
<name>辟邪剑谱</name>
<price>9.9</price>
<author>班主任</author>
</book>
<book sn="SN12341231">
<name><葵花宝典></name>
<price>99.99</price>
<author>班长</author>
</book>
<book sn="SN12233" name="java从入门到放弃"/><!--单标签-->
</books>
解析获取Document对象的代码:
先创建SaxReader对象。这个对象,用于读取xml文件,并创建Document对象。
/*
* dom4j获取Document对象
*/
@Test
public void test01() throws DocumentException {
//要创建一个Document对象,需要创建一个SAXReader
SAXReader saxReader = new SAXReader();
//saxReader来读取xml文件,然后会返回一个Document对象
Document doucument = saxReader.read("src/books.xml");
System.out.println(doucument);
运行后的结果为:
4.5 遍历xml标签,获取xml标签中的内容
遍历标签,获取所有标签中的内容需要分为四步操作:
- 第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象。
- 第二步:通过Document对象,拿到xml的根元素对象
- 第三步:通过根元素对象,获取所有的标签对象
- 第四步:遍历每个标签对象,获取标签对象内的每一个元素,再通过getText()方法得到起始标签与结束标签之间的文本内容。
public void test02() throws Exception {
/*第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象。
第二步:通过Document对象,拿到xml的根元素对象
第三步:通过根元素对象,获取所有的标签对象
第四步:遍历每个标签对象,获取标签对象内的每一个元素,再通过getText()方法得到起始标签与结束标签之间的文本内容。
*/
//第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象.
SAXReader saxReader = new SAXReader();
Document document = saxReader.read("src/books.xml");
//第二步:通过Document对象,拿到xml的根元素对象
Element rootElement = document.getRootElement();
//第三步:通过xml的根元素对象,获取所有book标签对象
List<Element> books = rootElement.elements("book");
//第四步:遍历每个book标签对象,然后获取book标签对象内的每一个元素
for (Element book : books) {
//获取book标签下的name元素对象
Element name = book.element("name");
//获取book标签下的price元素对象
Element price = book.element("price");
//获取book标签下的author元素对象
Element author = book.element("author");
//再通过getText()方法获取起始标签与结束标签之间的文本内容
System.out.println("书名"+name.getText()+",价格:"+price.getText()+
",作者:"+author.getText());
}
}
运行后的结果为:
总结
XML是可扩展(所谓可扩展就是程序员自己可以定义)的标记性语言。XML的主要作用是作为项目或者模块的配置文件。本节需要重点掌握的是dom4j解析技术,可以用来获取xml中所有标签对象中内容。