什么是XML
XML全称为Extensible MarkupLanguage,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。
W3C在1998年2月发布1.0版本,2004年2月又发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!
应用常见
配置文件
<?xml version="1.0"encoding="UTF-8"?>
<web-app version="2.5">
<servlet>
<servlet-name>HelloMyServlet</servlet-name>
<servlet-class>cn.itcast.HelloMyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>HelloMyServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
</web-app>
存放数据
<?xml version="1.0" encoding="UTF-8"?>
<persons>
<personid="p001">
<name>张三</name>
</person>
<personid="p002">
<name>李四</name>
</person>
</persons>
XML 语法
XML文档声明
<?xml version="1.0"encoding="UTF-8"?>
1. 文档声明必须为<?xml开头,以?>结束;
2. 文档声明必须从文档的0行0列位置开始;
3. 文档声明只有三个属性:
versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
encoding:指定当前文档的编码。可选属性,默认值是utf-8;
standalone:指定文档独立性。可选属性,默认值为yes,表示当前文档是独立文档。如果为no表示当前文档不是独立的文档,会依赖外部文件。
元素
<servlet>
1. 元素是XML文档中最重要的组成部分,
2. 普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
3. 元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>
4. 空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:<c/>
5. 元素命名:
区分大小写
不能使用空格,不能使用冒号:
不建议以XML、xml、Xml开头
6. 良好的XML文档,必须有一个根元素。
属性
<web-app version="2.5">
1. 属性是元素的一部分,它必须出现在元素的开始标签中
2. 属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3. 一个元素可以有0~N个属性,但一个元素中不能出现同名属性
4. 属性名不能使用空格、冒号等特殊字符,且必须以字母开头
注释
XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
转义字符
XML中的转义字符与HTML一样。
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。
CDATA区
<![CDATA[
任意内容
]]>
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
DTD约束
什么是DTD
DTD(Document TypeDefinition),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。
DTD重点要求
开发中,我们很少自己编写DTD约束文档,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2、hibernate等。
通过提供的DTD“web-app_2_3.dtd”编写XML
<?xml version="1.0"encoding="UTF-8"?>
<!--
传智播客DTD教学实例文档。
模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
格式如下:
<!DOCTYPEweb-app SYSTEM "web-app_2_3.dtd">
-->
<!ELEMENT web-app (servlet*,servlet-mapping* ,welcome-file-list?) >
<!ELEMENT servlet(servlet-name,description?,(servlet-class|jsp-file))>
<!ELEMENT servlet-mapping(servlet-name,url-pattern) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT welcome-file-list (welcome-file+)>
<!ELEMENT welcome-file (#PCDATA)>
<!ATTLIST web-app version CDATA #IMPLIED>
DTD语法
文档声明
1. 内部DTD,在XML文档内部嵌入DTD,只对当前XML有效。
<?xml version="1.0"encoding="utf-8" standalone="yes" ?>
<!DOCTYPE web-app [
... //具体的语法
]>
<web-app>
</web-app>
2. 外部DTD—本地DTD,DTD文档在本地系统上,公司内部自己项目使用。
<?xml version="1.0"encoding="utf-8" standalone="no" ?>
<!DOCTYPE web-app SYSTEM"web-app_2_3.dtd">
<web-app>
</web-app>
3. 外部DTD—公共DTD,DTD文档在网络上,一般都有框架提供。
<?xml version="1.0"encoding="UTF-8"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems,Inc.//DTD Web Application 2.3//EN""http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app>
</web-app>
元素声明
定义元素语法:<!ELEMENT元素名 元素描述>
元素名:自定义
元素描述包括:符号和数据类型
常见符号:? * + () | ,
常见类型:#PCDATA 表示内容是文档,不能是子标签
实例
<!ELEMENT web-app (servlet*,servlet-mapping* ,welcome-file-list?) >
web-app 包括3个标签,且必须顺序出现。
servlet子标签个数任意
servlet-mapping 子标签个数任意
welcome-file-list 子标签最多只能出现一次
<!ELEMENT servlet(servlet-name,description?,(servlet-class|jsp-file))>
servlet 有3个子标签,且必须顺序出现
servlet-name,必须有,且只能出现一次
description,可选一次
servlet-class 和 jsp-file 二选一,且只能出现一次
<!ELEMENT servlet-name (#PCDATA)>
servlet-name的标签体必须是文本
<!ELEMENT welcome-file-list (welcome-file+)>
welcome-file-list至少有一个子标签welcome-file
属性声明
属性的语法:
<!ATTLIST元素名
属性名属性类型 约束
属性名属性类型 约束
...
>
元素名:属性必须是给元素添加,所有必须先确定元素名
属性名:自定义
属性类型:ID、CDATA、枚举 …
ID : ID类型的属性用来标识元素的唯一性
CDATA:文本类型
枚举:(e1 | e2 | ...) 多选一
约束:
#REQUIRED:说明属性是必须的;
#IMPLIED:说明属性是可选的;
实例
<!ATTLIST web-app version CDATA #IMPLIED>
给web-app元素添加 version属性,属性值必须是文本,且可选。
<web-appversion="2.3"> 和 <web-app>都符号约束
Schema约束
什么是Schema
Schema是新的XML文档约束;
Schema要比DTD强大很多,是DTD 替代者;
Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml。
Schema 功能更强大,数据类型更完善
Schema 支持名称空间
Schema重点要求
与DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等
要求:可以通过提供“web-app_2_5.xsd”编写xml文档
<?xml version="1.0"encoding="UTF-8"?>
<!--
传智播客Schema教学实例文档。
模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
格式如下:
<web-appxmlns="http://www.example.org/web-app_2_5"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/web-app_2_5web-app_2_5.xsd"
version="2.5">
-->
<xsd:schemaxmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.example.org/web-app_2_5"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:tns="http://www.example.org/web-app_2_5"
elementFormDefault="qualified">
<xsd:elementname="web-app">
<xsd:complexType>
<xsd:choiceminOccurs="0" maxOccurs="unbounded">
<xsd:element name="servlet">
<xsd:complexType>
<xsd:sequence>
<xsd:elementname="servlet-name"></xsd:element>
<xsd:elementname="servlet-class"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="servlet-mapping">
<xsd:complexType>
<xsd:sequence>
<xsd:elementname="servlet-name"></xsd:element>
<xsd:elementname="url-pattern"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:elementname="welcome-file-list">
<xsd:complexType>
<xsd:sequence>
<xsd:elementname="welcome-file"maxOccurs="unbounded"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:choice>
<xsd:attributename="version" type="double"use="optional"></xsd:attribute>
</xsd:complexType>
</xsd:element>
</xsd:schema>
命名空间(语法)
什么是命名空间
如果一个XML文档中使用多个Schema文件,而这些Schema文件中定义了相同名称的元素时就会出现名字冲突。这就像一个Java文件中使用了importjava.util.*和import java.sql.*时,在使用Date类时,那么就不明确Date是哪个包下的Date了。
总之名称空间就是用来处理元素和属性的名称冲突问题,与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。
约束文档和XML关系
当W3C提出Schema约束规范时,就提供“官方约束文档”。我们通过官方文档,必须“自定义schema 约束文档”,开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定,编写出自己的xml文档。
声明命名空间
默认命名空间:<xxxxmlns=””> ,使用<标签>
显式命名空间:<xxxxmlns:别名=””> , 使用<别名:标签>
实例:web-app_2_5.xsd
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"…>
表示自定义schema约束文档引用官方文档作为显示命名空间。如果要使用官方提供的元素或属性,必须使用xsd前缀(自定义,此处表示官方文档,所以使用xsd)
<xsd:schema>标签就有官方文档提供,默认命名空间直接使用。
实例:web.xml
<web-appxmlns=http://www.example.org/web-app_2_5 …>
表示 xml 文档引用“自定义约束文档”作为默认命名空间
因为使用默认命名空间,<web-app>直接使用
其他介绍
自定义约束:web-app_2_5.xsd
<xsd:schematargetNamespace=http://www.example.org/web-app_2_5
表示给当前自定义约束文档进行起名,提供给xml文档使用。
xml文档:web.xml
<web-app
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation=http://www.example.org/web-app_2_5web-app_2_5.xsd
xmlns:xsi=”…”固定写法
表示是一个schema实例文档,就是被schema文档约束的xml文档。
xsi:schemaLocation=”名称 路径 名称路径 名称 路径…”
表示用于确定当前xml文档使用到的schema文档的位置。“名称 路径”是成对出现,与xmlns引用命名空间对应。
dom4j解析
XML解析概述
当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
解析方式和解析器
l 开发中比较常见的解析方式有三种,如下:
1. DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
缺点:XML文档过大,可能出现内存溢出显现。
2. SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
优点:处理速度快,可以处理大文件
缺点:只能读,逐行后将释放资源。
3. PULL:Android内置的XML解析方式,类似SAX。(了解)
解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
JAXP:sun公司提供支持DOM和SAX开发包
JDom:dom4j兄弟
jsoup:一种处理HTML特定解析开发包
dom4j:比较常用的解析开发包,hibernate底层采用。
DOM解析原理及结构模型
XML DOM 和 HTML DOM类似,XML DOM 将 整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作
DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!
API使用
如果需要使用dom4j,必须导入jar包。
dom4j 必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,然后就可以操作了。
常用API如下:
1. SaxReader对象
a) read(…) 加载执行xml文档
2. Document对象
getRootElement() 获得根元素
3. Element对象
elements(…) 获得指定名称的所有子元素。可以不指定名称
element(…) 获得指定名称第一个子元素。可以不指定名称
getName() 获得当前元素的元素名
attributeValue(…) 获得指定属性名的属性值
elementText(…) 获得指定名称子元素的文本值
getText() 获得当前元素的文本内容
@Test
public void demo03() throws Exception{
//#1 获得document
SAXReadersaxReader = new SAXReader();
Documentdocument = saxReader.read(new File("src/cn/itcast/a_xml/web.xml"));
//#2 获得根元素
ElementrootElement = document.getRootElement();
//打印version属性值
Stringversion = rootElement.attributeValue("version");
System.out.println(version);
//#3 获得所有子元素。例如:<servlet>/<servlet-mapping>
List<Element>allChildElement = rootElement.elements();
//#4 遍历所有
for(Element childElement : allChildElement) {
// #5.1 打印元素名
String childEleName =childElement.getName();
System.out.println(childEleName);
// #5.2 处理<servlet> ,并获得子标签的内容。例如:<servlet-name> 等
if("servlet".equals(childEleName)){
// 方式1:获得元素对象,然后获得文本
ElementservletNameElement = childElement.element("servlet-name");
StringservletName = servletNameElement.getText();
System.out.println("\t"+ servletName);
// 方式2:获得元素文本值
StringservletClass = childElement.elementText("servlet-class");
System.out.println("\t"+ servletClass);
}
// #5.3 处理<servlet-mapping> 省略...
}
}
案例实现
准备工作
为了模拟服务器端程序,且可以同时存在多个类似程序。故提供接口,接口中有3个方法,我们人为约定三个方法的调用顺序。
public interface MyServlet {
publicvoid init(); //1.初始化
publicvoid service(); //2.执行
publicvoid destory(); //3.销毁
}
在为接口编写实现类
public class HelloMyServlet implements MyServlet {
@Override
publicvoid init() {
System.out.println("1.初始化");
}
@Override
publicvoid service() {
System.out.println("2.执行中....");
}
@Override
publicvoid destory() {
System.out.println("3.销毁");
}
}
测试,创建实现类实例对象
public class TestApp {
@Test
publicvoid demo01(){
//手动创建执行
MyServlet myServlet = new HelloMyServlet();
myServlet.init();
myServlet.service();
myServlet.destory();
}
}
反射执行
测试程序我们直接new HelloServlet,这种编程方式我们称为硬编码,及代码写死了。为了后期程序的可扩展,开发中通常使用实现类的全限定类名(cn.itcast.e_web.HelloMyServlet),通过反射加载字符串指定的类,并通过反射创建实例。
@Test
public void demo02() throws Exception{
/* 反射创建执行
* 1) Class.forName 返回指定接口或类的Class对象
* 2) newInstance() 通过Class对象创建类的实例对象,相当于new Xxx();
*/
StringservletClass = "cn.itcast.e_web.HelloMyServlet";
//3 获得字符串实现类实例
Classclazz = Class.forName(servletClass);
MyServletmyServlet = (MyServlet) clazz.newInstance();
//4 执行对象的方法
myServlet.init();
myServlet.service();
myServlet.destory();
}
解析xml
使用反射我们已经可以创建对象的实例,此时我们使用的全限定类名,在程序是仍写死了,我们将器配置到xml文档中。
xml文档内容:
<?xml version="1.0"encoding="UTF-8"?>
<web-app version="2.5">
<servlet>
<servlet-name>HelloMyServlet</servlet-name>
<servlet-class>cn.itcast.e_web.HelloMyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>HelloMyServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
<servlet>
<servlet-name>HelloMyServlet2</servlet-name>
<servlet-class>cn.itcast.e_web.HelloMyServlet2</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>HelloMyServlet2</servlet-name>
<url-pattern>/hello2</url-pattern>
</servlet-mapping>
</web-app>
解析实现
@Test
public void demo03() throws Exception{
/* 读取xml配置文件,获得<servlet-class>配置的内容,取代固定字符串
*/
//1.1 加载xml配置文件,并获得document对象
SAXReadersaxReader = new SAXReader();
Documentdocument = saxReader.read(new File("src/cn/itcast/e_web/web.xml"));
//1.2 获得根元素
ElementrootElement = document.getRootElement();
//1.3 获得第一个<servlet> 子元素
ElementservletElement = rootElement.element("servlet");
//1.4 获得字符串实现类 <servlet-class>的值
StringservletClass = servletElement.elementText("servlet-class");
//3 获得字符串实现类实例
Classclazz = Class.forName(servletClass);
MyServletmyServlet = (MyServlet) clazz.newInstance();
//4 执行对象的方法
myServlet.init();
myServlet.service();
myServlet.destory();
}
模拟浏览器路径
上面我们已经解析xml,不过我们获得内容是固定。我们希望如果用户访问的路径是/hello,将执行cn.itcast.e_web.HelloMyServlet程序,如果访问时/hello2,将执行cn.itcast.e_web.HelloMyServlet2程序。
在执行测试程序前(@Before),解析xml文件,将解析的结果存放在Map中,map中数据的格式为:路径=实现类。
解析xml思路:先解析<servlet>,将结果存放map,name=class,然后再解析<servlet-mapping>通过name获得class,再将url=class存放到map,最后将name=class移除。
//最终存放key=请求路径,value=实现类
private Map<String, String> data = newHashMap<String,String>();
@Before
public void demo04Before() throws Exception{
//在执行前执行,解析xml,并将结果存放到Map<路径,实现类>中
//1 获得document
SAXReadersaxReader = new SAXReader();
Documentdocument = saxReader.read(new File("src/cn/itcast/e_web/web.xml"));
//2 获得根元素
ElementrootElement = document.getRootElement();
//3 获得所有的子元素 <servlet> 、<servlet-mapping>等
List<Element>allChildElement = rootElement.elements();
/* 4 遍历所有
* 1)解析到<servlet>,将其子标签<servlet-name>与<servlet-class>存放到Map中
* 2)解析到<servlet-mapping>,获得子标签<servlet-name>和<url-pattern>,从map中获得1的内容,组合成 url = class 键值对
*/
for(Element childElement : allChildElement) {
//4.1 获得元素名
String eleName = childElement.getName();
//4.2 如果是servlet,将解析内容存放到Map中
if("servlet".equals(eleName)){
StringservletName = childElement.elementText("servlet-name");
StringservletClass = childElement.elementText("servlet-class");
data.put(servletName,servletClass);
}
//4.3 如果是servlet-mapping,获得之前内容,组成成key=url,value=class并添加到Map中
if("servlet-mapping".equals(eleName)){
StringservletName = childElement.elementText("servlet-name");
StringurlPattern = childElement.elementText("url-pattern");
// 获得<servlet-name>之前存放在Map中<servlet-class>值
StringservletClass= data.get(servletName);
// 存放新的内容 url = class
data.put(urlPattern,servletClass);
// 将之前存放的数据删除
data.remove(servletName);
}
//打印信息
System.out.println(data);
}
}
模拟浏览器请求路径,通过url从map获得class,并使用反射执行实现类。
@Test
public void demo04() throws Exception{
//1 模拟路径
String url= "/hello";
// String url = "/hello2";
//2 通过路径获得对应的实现类
StringservletClass = data.get(url);
//3 获得字符串实现类实例
Classclazz = Class.forName(servletClass);
MyServletmyServlet = (MyServlet) clazz.newInstance();
//4 执行对象的方法
myServlet.init();
myServlet.service();
myServlet.destory();
}
浏览器访问(了解)
使用Socket编写服务,通过浏览器可以访问,并解析浏览器发送的请求数据,最终获得请求路径。
访问路径:http://localhost:8888/hello
@Test
public void demo05() throws Exception{
//使用socket获得请求路径
//1.1 给本地计算机绑定端口8888
ServerSocketserverSocket = new ServerSocket(8888);
//1.2 程序阻塞,等待浏览器请求。
Socketaccept = serverSocket.accept();
//1.3 获得请求所有数据
BufferedReaderreader = new BufferedReader(new InputStreamReader(accept.getInputStream()));
//1.4 获得第一行数据,请求行,例如:GET /hello HTTP/1.1
StringfirstLine = reader.readLine();
//1.5 请求行三部分数据由空格连接,获得中间数据。表示请求路径
String url= firstLine.split(" ")[1];
System.out.println(url);
//2 通过路径获得对应的实现类
StringservletClass = data.get(url);
//3 获得字符串实现类实例
Classclazz = Class.forName(servletClass);
MyServletmyServlet = (MyServlet) clazz.newInstance();
//4 执行对象的方法
myServlet.init();
myServlet.service();
myServlet.destory();
//5 释放资源
reader.close();
client.close();
}
显示效果
控制台显示效果
几秒之后,服务程序没有做出任何响应,浏览器将显示“无法访问”