图解HTTP-HTTP报文内的HTTP信息-学习总结归纳【1.3】

第4章返回结果的 HTTP 状态码

        HTTP状态码负责表示客户端HTTP请求的返回结果、标记服务器端的处理是否正常、通知出现的错误等工作。让我们通过本章的学习,好好了解一下状态码的工作机制。

4.1 状态码告知从服务器端返回的请求结果

        状态码的职责是当客户端向服务器端发送请求时,描述返回的请求结果。借助状态码,用户可以知道服务器端是正常处理了请求,还是出现了错误。

状态码如 200 OK,以 3 位数字和原因短语组成。
数字中的第一位指定了响应类别, 后两位无分类。响应类别有以下5 种。

        只要遵守状态码类别的定义,即使改变 RFC2616 中定义的状态码, 或服务器端自行创建状态码都没问题。 仅 记 录 在 RFC2616 上 的 HTTP 状 态 码 就 达 40 种, 若 再 加 上 WebDAV( Web-based Distributed Authoring and Versioning,基于万维网 的分布式创作和版本控制)( RFC4918、 5842)和附加 HTTP 状态码 ( RFC6585)等扩展,数量就达 60 余种。别看种类繁多,实际上经常使 用的大概只有 14 种。 接下来,我们就介绍一下这些具有代表性的 14 个 状态码。

4.2 2XX 成功

2XX 的响应结果表明请求被正常处理了。

4.2.1 200 OK

表示从客户端发来的请求在服务器端被正常处理了。 在响应报文内, 随状态码一起返回的信息会因方法的不同而发生改 变。比如,使用 GET 方法时,对应请求资源的实体会作为响应返回; 而使用 HEAD 方法时,对应请求资源的实体首部不随报文主体作为响 应返回(即在响应中只返回首部,不会返回实体的主体部分)。

4.2.2 204NoContent

        该状态码代表服务器接收的请求已成功处理,但在返回的响应报文 中不含实体的主体部分。 另外,也不允许返回任何实体的主体。比如, 当从浏览器发出请求处理后, 返回 204 响应,那么浏览器显示的页面不 发生更新。 一般在只需要从客户端往服务器发送信息, 而对客户端不需要发送 新信息内容的情况下使用。

4.2.3 206 Partial Content

该状态码表示客户端进行了范围请求,而服务器成功执行了这部分 的 GET 请求。响应报文中包含由 Content-Range 指定范围的实体内容。

4.3 3XX 重定向

3XX 响应结果表明浏览器需要执行某些特殊的处理以正确处理 请求。

4.3.1 301 Moved Permanently

        永久性重定向。该状态码表示请求的资源已被分配了新的 URI,以 后应使用资源现在所指的 URI。也就是说,如果已经把资源对应的 URI 保存为书签了,这时应该按 Location 首部字段提示的 URI 重新保存。 像下方给出的请求 URI,当指定资源路径的最后忘记添加斜杠 “/”,就会产生 301 状态码。 http://example.com/sample

4.3.2 302 Found

        临时性重定向。该状态码表示请求的资源已被分配了新的 URI,希 望用户(本次)能使用新的 URI 访问。058 和 301 Moved Permanently 状态码相似,但 302 状态码代表的资源 不是被永久移动, 只是临时性质的。换句话说,已移动的资源对应的 URI 将来还有可能发生改变。比如,用户把 URI 保存成书签, 但不会像 301 状态码出现时那样去更新书签, 而是仍旧保留返回 302 状态码的页 面对应的 URI。

4.3.3 303 See Other

        该状态码表示由于请求对应的资源存在着另一个 URI,应使用 GET 方法定向获取请求的资源。 303 状态码和 302 Found 状态码有着相同的功能,但 303 状态码明 确表示客户端应当采用 GET 方法获取资源,这点与 302 状态码有区别。 比如,当使用 POST 方法访问 CGI 程序,其执行后的处理结果是希 望客户端能以 GET 方法重定向到另一个 URI 上去时,返回 303 状态码。 虽然 302 Found 状态码也可以实现相同的功能,但这里使用 303 状态码 是最理想的。

        当 301、302、303 响应状态码返回时,几乎所有的浏览器都会把 POST 改成 GET,并删除请求报文内的主体,之后请求会自动再次发送。 301、302 标准是禁止将 POST 方法改变成 GET 方法的,但实际使用 时大家都会这么做。

4.3.4 304NotModified

        该状态码表示客户端发送附带条件的请求 A 时,服务器端允许请求 访问资源,但未满足条件的情况。 304 状态码返回时,不包含任何响应 的主体部分。 304 虽然被划分在 3XX 类别中,但是和重定向没有关系。

4.3.5 307 Temporary Redirect

        临时重定向。该状态码与 302 Found 有着相同的含义。尽管 302 标 准禁止 POST 变换成 GET,但实际使用时大家并不遵守。 307 会遵照浏览器标准, 不会从 POST 变成 GET。但是,对于处理 响应时的行为,每种浏览器有可能出现不同的情况。 A 附带条件的请求是指采用GET方法的请求报文中包含If-Match, If-ModifiedSince, If-None-Match, If-Range, If-Unmodified-Since中任一首部。

4.4 4XX 客户端错误

4XX 的响应结果表明客户端是发生错误的原因所在。

4.4.1 400 Bad Request

该状态码表示请求报文中存在语法错误。当错误发生时,需修改请求 的内容后再次发送请求。另外,浏览器会像 200 OK 一样对待该状态码。

4.4.2 401 Unauthorized

        该状态码表示发送的请求需要有通过 HTTP 认证( BASIC 认证、 DIGEST 认证)的认证信息。 另外若之前已进行过 1 次请求,则表示用 户认证失败。 返回含有 401 的响应必须包含一个适用于被请求资源的 WWWAuthenticate 首部用以质询( challenge)用户信息。当浏览器初次接收 到 401 响应,会弹出认证用的对话窗口。

4.4.3 403 Forbidden

        该状态码表明对请求资源的访问被服务器拒绝了。服务器端没有必 要给出拒绝的详细理由, 但如果想作说明的话,可以在实体的主体部分 对原因进行描述,这样就能让用户看到了。 未获得文件系统的访问授权, 访问权限出现某些问题(从未授权的 发送源 IP 地址试图访问)等列举的情况都可能是发生 403 的原因。

4.4.4 404 Not Found

该状态码表明服务器上无法找到请求的资源。除此之外,也可以在 服务器端拒绝请求且不想说明理由时使用。

4.5 5XX 服务器错误

5XX 的响应结果表明服务器本身发生错误。

4.5.1 500 Internal Server Error

该状态码表明服务器端在执行请求时发生了错误。也有可能是 Web 应用存在的 bug 或某些临时的故障。

4.5.2 503 Service Unavailable

        该状态码表明服务器暂时处于超负载或正在进行停机维护,现在无 法处理请求。 如果事先得知解除以上状况需要的时间,最好写入 RetryAfter 首部字段再返回给客户端。状态码和状况的不一致 不少返回的状态码响应都是错误的,但是用户可能察觉不到这点。比 如 Web 应用程序内部发生错误,状态码依然返回 200 OK,这种情况也经 常遇到。 

第5章与HTTP协作的Web服务器

一台Web服务器可搭建多个独立域名的Web网站,也可作为通信路径上的中转服务器提升传输效率。

5.1  用单台虚拟主机实现多个域名

        HTTP/1.1 规范允许一台 HTTP 服务器搭建多个 Web 站点。比如, 提供 Web 托管服务( Web Hosting Service)的供应商,可以用一台服务 器为多位客户服务,也可以以每位客户持有的域名运行各自不同的网站。 这是因为利用了虚拟主机( Virtual Host,又称虚拟服务器)的功能。 即使物理层面只有一台服务器, 但只要使用虚拟主机的功能,则可 以假想已具有多台服务器。

         客户端使用 HTTP 协议访问服务器时,会经常采用类似 www.hackr. jp 这样的主机名和域名。 在互联网上, 域名通过 DNS 服务映射到 IP 地址(域名解析)之后 访问目标网站。 可见,当请求发送到服务器时,已经是以 IP 地址形式 访问了。 所以,如果一台服务器内托管了 www.tricorder.jp 和 www.hackr.jp 这两个域名,当收到请求时就需要弄清楚究竟要访问哪个域名。

        在相同的 IP 地址下,由于虚拟主机可以寄存多个不同主机名和域 名的 Web 网站,因此在发送 HTTP 请求时,必须在 Host 首部内完整指 定主机名或域名的 URI。

5.2  通信数据转发程序:代理、网关、隧道

        HTTP 通信时,除客户端和服务器以外,还有一些用于通信数据转 发的应用程序,例如代理、网关和隧道。它们可以配合服务器工作。 这些应用程序和服务器可以将请求转发给通信线路上的下一站服务 器,并且能接收从那台服务器发送的响应再转发给客户端。 代理 代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端 “中间人”的角色, 接收由客户端发送的请求并转发给服务器,同 时也接收服务器返回的响应并转发给客户端。 网关 网关是转发其他服务器通信数据的服务器,接收从客户端发送来的 请求时,它就像自己拥有资源的源服务器一样对请求进行处理。有 时客户端可能都不会察觉,自己的通信目标是一个网关。隧道隧道是在相隔甚远的客户端和服务器两者之间进行中转,并保持双方通信连接的应用程序。

5.2.1 代理

代理服务器的基本行为就是接收客户端发送的请求后转发给其他 服务器。代理不改变请求 URI,会直接发送给前方持有资源的目标服 务器。 持有资源实体的服务器被称为源服务器。 从源服务器返回的响应经 过代理服务器后再传给客户端。

在 HTTP 通信过程中,可级联多台代理服务器。请求和响应的转发 会经过数台类似锁链一样连接起来的代理服务器。 转发时,需要附加 Via 首部字段以标记出经过的主机信息。

        使用代理服务器的理由有:利用缓存技术(稍后讲解)减少网络带 宽的流量,组织内部针对特定网站的访问控制,以获取访问日志为主要 目的,等等。 代理有多种使用方法, 按两种基准分类。一种是是否使用缓存,另 一种是是否会修改报文。 缓存代理 代理转发响应时,缓存代理( Caching Proxy)会预先将资源的副本 (缓存)保存在代理服务器上。 当代理再次接收到对相同资源的请求时, 就可以不从源服务器那里 获取资源,而是将之前缓存的资源作为响应返回。 透明代理 转发请求或响应时,不对报文做任何加工的代理类型被称为透明代 理( Transparent Proxy)。反之,对报文内容进行加工的代理被称为 非透明代理。

5.2.2 网关
 

        网关的工作机制和代理十分相似。而网关能使通信线路上的服务器 提供非 HTTP 协议服务。 利用网关能提高通信的安全性, 因为可以在客户端与网关之间的通 信线路上加密以确保连接的安全。 比如,网关可以连接数据库,使用 SQL 语句查询数据。 另外,在 Web 购物网站上进行信用卡结算时,网 关可以和信用卡结算系统联动。

5.2.3 隧道

        隧道可按要求建立起一条与其他服务器的通信线路,届时使用 SSL 等加密手段进行通信。 隧道的目的是确保客户端能与服务器进行安全的 通信。 隧道本身不会去解析 HTTP 请求。也就是说,请求保持原样中转给 之后的服务器。隧道会在通信双方断开连接时结束。

5.3 保存资源的缓存

        缓存是指代理服务器或客户端本地磁盘内保存的资源副本。利用缓 存可减少对源服务器的访问,因此也就节省了通信流量和通信时间。 缓存服务器是代理服务器的一种, 并归类在缓存代理类型中。换句 话说,当代理转发从服务器返回的响应时,代理服务器将会保存一份资 源的副本。

缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。 因此客户端可就近从缓存服务器上获取资源, 而源服务器也不必多次处 理相同的请求了。

5.3.1 缓存的有效期限

        即便缓存服务器内有缓存,也不能保证每次都会返回对同资源的请 求。因为这关系到被缓存资源的有效性问题。 当遇上源服务器上的资源更新时, 如果还是使用不变的缓存,那就 会演变成返回更新前的“旧”资源了。 即使存在缓存, 也会因为客户端的要求、缓存的有效期等因素,向 源服务器确认资源的有效性。 若判断缓存失效,缓存服务器将会再次从 源服务器上获取“新”资源。

5.3.2 客户端的缓存

        缓存不仅可以存在于缓存服务器内,还可以存在客户端浏览器中。以 Internet Explorer 程序为例,把客户端缓存称为临时网络文件( Temporary Internet File)。 浏览器缓存如果有效, 就不必再向服务器请求相同的资源了,可以 直接从本地磁盘内读取。 另外,和缓存服务器相同的一点是,当判定缓存过期后,会向源服 务器确认资源的有效性。 若判断浏览器缓存失效,浏览器会再次请求新 资源。

        在 HTTP 出现之前的协议 在 HTTP 普及之前,也就是从互联网的诞生期至今,曾出现过各式各 样的协议。在 HTTP 规范确立之际,制定者们参考了那些协议的功能。也 有某些协议现在已经彻底退出了人们的视线。接下来,我们会简单介绍一 下这些协议。 FTP (File Transfer Protocol) 传输文件时使用的协议。该协议历史久远,可追溯到 1973 年前后, 比 TCP/IP 协 议 族 的 出 现 还 要 早。 虽 然 它 在 1995 年 被 HTTP 的 流 量 (Traffic)超越,但时至今日,仍被广泛沿用。 NNTP (Network News Transfer Protocol) 用于 NetNews 电子会议室内传送消息的协议。在 1986 年前后出现, 属于比较古老的一类协议。现在,利用 Web 交换信息已成主流,所以该 协议已经不怎么使用了。 Archie 搜索 anonymous FTP 公开的文件信息的协议。1990 年前后出现,现 在已经不常使用。WAIS(Wide Area Information Servers) 以关键词检索多个数据库使用的协议。1991 年前后出现。由于现在 已经被 HTTP 协议替代,也已经不怎么使用了。 Gopher 查找与互联网连接的计算机内信息的协议。1991 年前后出现,由于 现在已经被 HTTP 协议替代,也已经不怎么使用了。

  • 10
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BinaryStarXin

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值