Day54.XML解析(DOM4J)、Tomcat服务器、HTML协议简介: 请求、响应报文、响应码

焰火青年·

已于 2022-05-20 00:01:56 修改

阅读量1.1k

点赞数

分类专栏： Web 文章标签：服务器 html javaee tomcat web

于 2022-04-30 14:03:42 首次发布

本文链接：https://blog.csdn.net/a111042555/article/details/124510692

版权

Web 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、XML的基本语法

XML—(Xtensible Markup Language)，翻译过来就是可扩展标记语言。XML和HTML都是标记语言它们的基本语法都是标签。在XML基本语法规范的基础上，你使用第三方应用程序、框架会通过设计『XML约束』的方式『强制规定』配置文件中可以写什么和怎么写，

XML基本语法这个知识点的定位是：我们不需要从零开始，从头到尾的一行一行编写XML文档，而是在第三方应用程序、框架已提供的配置文件的基础上修改。要改成什么样取决于你的需求，而怎么改取决于XML基本语法和具体的XML约束。

XML用来传输和存储数据，HTML用来显示数据。

XML文档声明

这部分基本上就是固定格式，要注意的是文档声明一定要从第一行第一列开始写
<?xml version="1.0" encoding="UTF-8"?>
根标签:根标签有且只能有一个。

标签关闭

双标签：开始标签和结束标签必须成对出现。

单标签：单标签在标签内关闭。

标签嵌套

可以嵌套，但是不能交叉嵌套。

注释不能嵌套

标签名、属性名建议使用小写字母

属性

属性必须有值

属性值必须加引号，单双都行

XML解析(使用DOM4J解析器)

XML的两种解析方式

DOM解析:将文档加载进内存，形成一颗dom树(document对象)，将文档的各个组成部分封装为一些对象。优点：方便操作，缺点：占用内存大
SAX解析:逐行读取，基于事件驱动，解析一行释放一行，内存占用非常小

常见的XML解析器

在使用Java代码解析XML的时候，通常不会直接使用JDK内置的原生的DOM或者SAX解析XML，因为代码实在是太复杂了。通常会使用第三方XML解析器来解析XML

JAXP: sun公司提供的解析。支持dom和sax。（不常用）
JDOM
DOM4J（常用）

使用DOM4J解析XML文件

导入jar包 dom4j.jar
创建解析器对象(SAXReader)
解析xml 获得Document对象
获取根节点RootElement
获取根节点下的子节点

        //1.创建解析器对象
        SAXReader saxReader = new SAXReader();
        //2.解析xml文件形成文档树
        Document document = saxReader.read(Parse2Test.class.getClassLoader().getResourceAsStream("persons.xml"));

        //3.获取根节点   <persons>节点
        Element rootElement = document.getRootElement();

        //4.获取子节点集合   <persons>的所有子节点。<student> <smallstudent>
        List<Element> allElements = rootElement.elements();

        //5.遍历集合，取每一个子节点 (child: 孩子)
        for (Element childElement : allElements) {
            //<student>下的子节点节点, <name> <age> <sex> <address>
            List<Element> sunZiElements = childElement.elements();

            for (Element element : sunZiElements) {
                //获取标签名
                String name = element.getName();
                //获取标签中文本值
                String text = element.getText();

                //获取标签内指定属性对应的值
                String info = element.attributeValue("info");
                if(info==null){
                    System.out.println(name +"-->" +text);
                }else {
                    System.out.println(name +"-->" +text+"info-->"+info);
                }
            }
            System.out.println();
        }

persons.xml 文件:

<?xml version="1.0" encoding="UTF-8" ?>
<persons>
    <student>
        <name>李白</name>
        <age>13</age>
        <sex>男</sex>
        <address info="北京市昌平区宏福苑38号楼602"/>
    </student>
    <student>
        <name>杜甫</name>
        <age>19</age>
        <sex>男</sex>
        <address info="北京市昌平区宏福大厦38号楼602"/>
    </student>
    <student>
        <name>李清照</name>
        <age id="002">29</age>
        <sex>女</sex>
    </student>
    <smallstudent>
        <name>小李</name>
        <age id="003">9</age>
        <sex>男</sex>
    </smallstudent>
</persons>

xpath：用于获取文档树中某一部分内容

/*
xPath：用于获取文档树中某一部分内容
需要导入另一个Jar包：jaxen-1.1-beta-6.jar
document.selectNodes("路径规则"); 所有满足路径规则的标签
document.selectSingleNode("路径规则"); 获取满足路径规则的第一个值
路径规则：详见说明文档
 */
public class Parse3Test {
    public static void main(String[] args) throws Exception {
        //1.创建解析器对象
        SAXReader saxReader = new SAXReader();
        //2.读取文件形成dom树
        Document document = saxReader.read(Parse3Test.class.getClassLoader().getResourceAsStream("persons.xml"));

        //3.获取指定内容 (所有标签名为name的)节点
        List<Element> list = document.selectNodes("//name");
        //List<Element> list = document.selectNodes("//name[@id]"); 获取所有name节点中包含id属性的
        //List<Element> list = document.selectNodes("//name[@id=003]"); 获取所有name节点中id属性=003的

        for (Element element : list) {
            String name = element.getName();
            String text = element.getText();
            System.out.println(name+"-->"+text);
        }
    }
}

二、Web服务器

JavaWeb，所有通过Java语言编写的可以通过浏览器访问的程序的总称，叫JavaWeb。（Java写的程序，浏览器可以访问）JavaWeb是基于请求和响应来开发的。

什么是请求：请求 (Request)，指客户端给服务器发送数据。
什么是响应：响应 (Response)，指服务器给客户端回传数据。

Web服务器通常由硬件和软件共同构成。

硬件：电脑，提供服务供其它客户电脑访问
软件：电脑上安装的服务器软件，安装后能提供服务给网络中的其他计算机，将本地文件映射成一个虚拟的url地址供网络中的其他人访问。

常见的JavaWeb服务器：

Tomcat（Apache）：当前应用最广的JavaWeb服务器

JBoss（Redhat红帽）：支持JavaEE，应用比较广EJB容器 –> SSH轻量级的框架代替

GlassFish（Orcale）：Oracle开发JavaWeb服务器，应用不是很广

Resin（Caucho）：支持JavaEE，应用越来越广

Weblogic（Orcale）：要钱的！支持JavaEE，适合大型项目

Websphere（IBM）：要钱的！支持JavaEE，适合大型项目

Tomcat服务器

使用Tomat，需要配置JAVA_HOME环境变量

Tomcat 服务器和 Servlet 版本的对应关系

Tomcat目录介绍：

bin             专门用来存放Tomcat服务器的可执行程序
conf          专门用来存放Tomcat服务器的配置文件
lib               专门用来存放Tomcat服务器jar包
logs     专门用来存放Tomcat服务器运行时输出的日记信息
temp             专门用来存放Tomcat服务器运行时产生的临时数据
webapps       专门用来存放部署的Web工程
work               Tomcat工作时的目录，可以用来存放Tomcat运行时jsp翻译为servlet的源码，和Session钝化(序列化、写入磁盘)的目录

在IDEA中配置Tomcat

动态Web工程部署与测试

高版本IDEA：创建完成后

配置成功后：

tomcat实例的基础设置

由于每次创建项目随之创建的tomcat实例名字都类似，所以建议修改一下tomcat实例的名称

三、HTTP协议简介

HTTP 超文本传输协议 (HTTP-Hypertext transfer protocol) ，它是一种详细规定了浏览器和万维网服务器之间互相通信的规则，通过因特网传送万维网文档的数据传送协议。客户端与服务端通信时传输的内容我们称之为报文。HTTP协议就是规定报文的格式。

报文：数据传输的格式
客户端 --> 服务端：请求报文
服务端 --> 客户端：响应报文

HTTP协议的会话方式

浏览器与服务器之间的通信过程要经历四个步骤

建立连接：三次握手关闭链接：四次挥手

浏览器与WEB服务器的连接过程是短暂的，每次连接只处理一个请求和响应。对每一个页面的访问，浏览器与WEB服务器都要建立一次单独的连接。
浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应对。

请求报文

请求报文：客户端向服务端发起响应时，包含请求行、请求头、请求体。

get：请求能够携带的参数较少，大小有限制，会在浏览器的URL地址栏显示数据类容，不安全，但高效。
post：请求能够携带的参数没有限制，大小没有限制，不会在浏览器的URL地址栏显示数据内容，安全，但不高效。

get 请求

请求(首)行:
    请求方式   提交地址:应用名+资源名   提交的数据       协议  版本
      GET    /day11Web/success.html?uname=zs&pwd=123 HTTP/ 1.1

请求头:
     Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
     ↑ 浏览器支持的文件类型
     Accept-Language: zh-CN,zh;q=0.9
     ↑ 浏览器支持的语言
     Connection: keep-alive 保持连接(长连接)
            
     Cookie: Idea-dba54f96=c3a62b54-de1c-464e-898b-19755c8e4fdb
     会话控制
     Host: localhost:8080 (主机地址)

     Referer: http://localhost:8080/day11Web/ 请求的来源,可以通过此路径跳转回上一个页面
     防止盗链

     User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36 
     客户端信息 (当前系统、浏览器信息)

请求体：get 请求数据在浏览器的地址栏没有请求体

post 请求

 请求行
   请求方式 提交地址:应用名+资源名    协议 版本
     POST  /day11Web/success.html   HTTP/1.1

请求头
       接收的文件类型
       Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9

       Accept-Language: zh-CN,zh;q=0.9  语言类型
       Connection: keep-alive  保持连接
       Cookie: Idea-dba54f96=c3a62b54-de1c-464e-898b-19755c8e4fdb 会话控制
       Host: localhost:8080 主机名
       Referer: http://localhost:8080/day11Web/  防止盗链
       客户端信息：判断是手机还是电脑
       User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36

请求体：
      发送请求时携带的数据
       uname=zs&pwd=123

响应报文

响应报文：服务器返回数据给客户端的数据格式

 响应行:
      协议/版本 状态码
      HTTP/1.1 200

响应头
      最后修改时间
      Last-Modified: Tue, 03 May 2022 06:01:31 GMT
      Content-Type: text/html  内容类型
      Content-Length: 590 内容的大小 单位是字节
      Date: Tue, 03 May 2022 06:15:24 GMT 时间是0时区的 找当前时间是 +8:00

响应体：html、css、js、图片

响应码

200：请求成功，浏览器会把响应体内容（通常是html）显示在浏览器中；
404：请求的资源没有找到，说明客户端错误的请求了不存在的资源；
500：请求资源找到了，但服务器内部出现了错误；
302：重定向，当响应码为302时，表示服务器要求浏览器重新再发一个请求，服务器会发送一个响应头Location，它指定了新请求的URL地址；

全部响应码：

200 - 服务器成功返回网页
404 - 请求的网页不存在
503 - 服务不可用
详细分解：

1xx（临时响应）
表示临时响应并需要请求者继续执行操作的状态代码。

代码说明
100 （继续）请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分，正在等待其余部分。
101 （切换协议）请求者已要求服务器切换协议，服务器已确认并准备切换。

2xx （成功）
表示成功处理了请求的状态代码。

代码说明
200 （成功）服务器已成功处理了请求。通常，这表示服务器提供了请求的网页。
201 （已创建）请求成功并且服务器创建了新的资源。
202 （已接受）服务器已接受请求，但尚未处理。
203 （非授权信息）服务器已成功处理了请求，但返回的信息可能来自另一来源。
204 （无内容）服务器成功处理了请求，但没有返回任何内容。
205 （重置内容）服务器成功处理了请求，但没有返回任何内容。
206 （部分内容）服务器成功处理了部分 GET 请求。

3xx （重定向）
表示要完成请求，需要进一步操作。通常，这些状态代码用来重定向。

代码说明
300 （多种选择）针对请求，服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作，或提供操作列表供请求者选择。
301 （永久移动）请求的网页已永久移动到新位置。服务器返回此响应（对 GET 或 HEAD 请求的响应）时，会自动将请求者转到新位置。
302 （临时移动）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。
303 （查看其他位置）请求者应当对不同的位置使用单独的 GET 请求来检索响应时，服务器返回此代码。
304 （未修改）自从上次请求后，请求的网页未修改过。服务器返回此响应时，不会返回网页内容。
305 （使用代理）请求者只能使用代理访问请求的网页。如果服务器返回此响应，还表示请求者应使用代理。
307 （临时重定向）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。

4xx（请求错误）
这些状态代码表示请求可能出错，妨碍了服务器的处理。

代码说明
400 （错误请求）服务器不理解请求的语法。
401 （未授权）请求要求身份验证。对于需要登录的网页，服务器可能返回此响应。
403 （禁止）服务器拒绝请求。
404 （未找到）服务器找不到请求的网页。
405 （方法禁用）禁用请求中指定的方法。
406 （不接受）无法使用请求的内容特性响应请求的网页。
407 （需要代理授权）此状态代码与 401（未授权）类似，但指定请求者应当授权使用代理。
408 （请求超时）服务器等候请求时发生超时。
409 （冲突）服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。
410 （已删除）如果请求的资源已永久删除，服务器就会返回此响应。
411 （需要有效长度）服务器不接受不含有效内容长度标头字段的请求。
412 （未满足前提条件）服务器未满足请求者在请求中设置的其中一个前提条件。
413 （请求实体过大）服务器无法处理请求，因为请求实体过大，超出服务器的处理能力。
414 （请求的 URI 过长）请求的 URI（通常为网址）过长，服务器无法处理。
415 （不支持的媒体类型）请求的格式不受请求页面的支持。
416 （请求范围不符合要求）如果页面无法提供请求的范围，则服务器会返回此状态代码。
417 （未满足期望值）服务器未满足”期望”请求标头字段的要求。

5xx（服务器错误）
这些状态代码表示服务器在尝试处理请求时发生内部错误。这些错误可能是服务器本身的错误，而不是请求出错。

代码说明
500 （服务器内部错误）服务器遇到错误，无法完成请求。
501 （尚未实施）服务器不具备完成请求的功能。例如，服务器无法识别请求方法时可能会返回此代码。
502 （错误网关）服务器作为网关或代理，从上游服务器收到无效响应。
503 （服务不可用）服务器目前无法使用（由于超载或停机维护）。通常，这只是暂时状态。
504 （网关超时）服务器作为网关或代理，但是没有及时从上游服务器收到请求。
505 （HTTP 版本不受支持）服务器不支持请求中所用的 HTTP 协议版本。

HttpWatch状态码Result is

200 - 服务器成功返回网页，客户端请求已成功。
302 - 对象临时移动。服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。
304 - 属于重定向。自上次请求后，请求的网页未修改过。服务器返回此响应时，不会返回网页内容。
401 - 未授权。请求要求身份验证。对于需要登录的网页，服务器可能返回此响应。
404 - 未找到。服务器找不到请求的网页。
2xx - 成功。表示服务器成功地接受了客户端请求。
3xx - 重定向。表示要完成请求，需要进一步操作。客户端浏览器必须采取更多操作来实现请求。例如，浏览器可能不得不请求服务器上的不同的页面，或通过代理服务器重复该请求。
4xx - 请求错误。这些状态代码表示请求可能出错，妨碍了服务器的处理。
5xx - 服务器错误。表示服务器在尝试处理请求时发生内部错误。这些错误可能是服务器本身的错误，而不是请求出错。