HTTP报文
客户端的请求或者服务端的响应
请求报文格式
<method>请求方法 <request-URL>请求资源 <version>http版本号(格式HTTP/<major>.<minor>) 这一行被称为起始行
<headers> 首部
<entity-body>实体主体
响应报文格式
<version>http版本号(格式HTTP/<major>.<minor>) <status>状态码 <reason-phrase>原因短语 这一行被称为起始行
<headers>首部
<entity-body>实体主体(实体的主体或报文的主体(或者就称为主体)是一个可选的数据块。与起始行和首部不同的是,主体中可以包含文本或二进制数据,也可以为空。)
起始行与首部是由行分隔的ASCII文本(每行都以一个由两个字符组成的行终止序列作为结束,其中包括一个回车符(ASCII 码 13)和一个换行符(ASCII 码 10))。这个行终止序列可以写做 CRLF。需要指出的是,尽管 HTTP 规范中说明应该用 CRLF 来表示行终止,但稳健的应用程序也应该接受单个换行符作为行的终止。有些老的,或不完整的 HTTP 应用程序并不总是既发送回车符,又发送换行符。)
首部的结束:一个空行(CRLF),标志着首部结束,主体开始。
主体的结束:一个空行(CRLF)
即使是没有任何首部或者主体,都应该含有CRLF
首部(名+空格+值+CRLF)
常用HTTP方法
方法
|
描述
|
是否包含主体
|
GET
|
从服务器获取一份文档
|
否
|
HEAD
|
只从服务器获取文档的首部
|
否
|
POST
|
向服务器发送需要处理的数据
|
是
|
PUT
|
将请求的主体部分存储在服务器上
|
是
|
TRACE
|
对可能经过代理服务器传送到服务器上去的报文进行追踪
|
否
|
OPTIONS
|
决定可以在服务器上执行哪些方法
|
否
|
DELETE
|
从服务器上删除一份文档
|
否
|
GET : 是最常用的方法。通常用于请求服务器发送某个资源。
HEAD : 与 GET 方法的行为很类似,但服务器在响应中只返回首部。不会返回实体的主体部分。这就允许客户端在未获取实际资源的情况下,对资源的首部进行检查。
1) 在不获取资源的情况下了解资源的情况(比如,判断其类型);
2) 通过查看响应中的状态码,看看某个对象是否存在;
3) 通过查看首部,测试资源是否被修改了。
PUT : 与 GET 从服务器读取文档相反,PUT 方法会向服务器写入文档。
POST : POST 方法起初是用来向服务器输入数据的。实际上,通常会用它来支持 HTML 的表单。表单中填好的数据通常会被送给服务器,然后由服务器将其发送到它要去的地方(比如,送到一个服务器网关程序中,然后由这个程序对其进行处理)。
TRACE : 客户端发起一个请求时,这个请求可能要穿过防火墙、代理、网关或其他一些应用程序。每个中间节点都可能会修改原始的 HTTP 请求。TRACE 方法允许客户端在最终将请求发送给服务器时,看看它变成了什么样子。
TRACE 请求会在目的服务器端发起一个“环回”诊断。行程最后一站的服务器会弹回一条 TRACE 响应,并在响应主体中携带它收到的原始请求报文。这样客户端就可以查看在所有中间 HTTP 应用程序组成的请求 / 响应链上,原始报文是否,以及如何被毁坏或修改过。
OPTIONS : 方法请求 Web 服务器告知其支持的各种功能。可以询问服务器通常支持哪些方法,或者对某些特殊资源支持哪些方法。(有些服务器可能只支持对一些特殊类型的对象使用特定的操作)
DELETE : 请求服务器删除指定URL的资源。
状态码
整体范围
|
已定义范围
|
分类
|
100~199
|
100~101
|
信息提示
|
200~299
|
200~206
|
成功
|
300~399
|
300~305
|
重定向
|
400~499
|
400~415
|
客户端错误
|
500~599
|
500~505
|
服务器错误
|
标志着服务器对请求的响应状态,与原因短语组合使得响应秒速更加清晰。状态及原因短语组合:
100 continue :目的是对这样的情况进行优化:HTTP 客户端应用程序有一个实体的主体部分要发送给服务器,但希望在发送之前查看一下服务器是否会接受这个实体。
200 OK : 请求没问题,实体的主体部分包含了所请求的资源。
201 Created : 用于创建服务器对象的请求(比如,PUT)。响应的实体主体部分中应该包含各种引用了已创建的资源的URL,Location首部包含的则是最具体的引用。服务器必须在发送这个状态码之前创建好对象
202 Accepted : 请求已被接受,但服务器还未对其执行任何动作。不能保证服务器会完成这个请求;这只是意味着接受请求时,它看起来是有效的。 服务器应该在实体的主体部分包含对请求状态的描述,或许还应该有对请求完成时间的估计(或者包含一个指针,指向可以获取此信息的位置)
203 Non-Authoritative Information : 实体首部(更多有关实体首部的信息参见3.5.4节)包含的信息不是来自于源端服务器,而是来自资源的一份副本。如果中间节点上有一份资源副本,但无法或者没有对它所发送的与资源有关的元信息(首部)进行验证,就会出现这种情况。 这种响应码并不是非用不可的;如果实体首部来自源端服务器,响应为200状态的应用程序就可以将其作为一种可选项使用
204 No Content : 响应报文中包含若干首部和一个状态行,但没有实体的主体部分。主要用于在浏览器不转为显示新文档的情况下,对其进行更新(比如刷新一个表单页面)
205 Reset Content : 另一个主要用于浏览器的代码。负责告知浏览器清除当前页面中的所有HTML 表单元素
300 Multiple Choices : 客户端请求一个实际指向多个资源的URL时会返回这个状态码,比如服务器上有某个HTML文档的英语和法语版本。返回这个代码时会带有一个选项列表;这样用户就可以选择他希望使用的那一项了。有多个版本可用时,客户端需要沟通解决,更多与此有关的信息请参见第17章。服务器可以在Location 首部包含首选URL
301 Moved Permanently : 在请求的URL已被移除时使用。响应的Location 首部中应该包含资源现在所处的URL 302 Found 与301状态码类似;但是,客户端应该使用Location 首部给出的URL来临时定位资源。将来的请求仍应使用老的URL
303 See Other : 告知客户端应该用另一个URL来获取资源。新的URL位于响应报文的 Location 首部。其主要目的是允许POST请求的响应将客户端定向到某个资源上去
304 Not Modified : 客户端可以通过所包含的请求首部,使其请求变成有条件的。更多有关条件首部的内容请参见第3章。如果客户端发起了一个条件GET请求,而最近资源未被修改的话,就可以用这个状态码来说明资源未被修改。带有这个状态码的响应不应该包含实体的主体部分
305 Use Proxy : 用来说明必须通过一个代理来访问资源;代理的位置由Location 首部给出。很重要的一点是,客户端是相对某个特定资源来解析这条响应的,不能假定所有请求,甚至所有对持有所请求资源的服务器的请求都通过这个代理进行。如果客户端错误地让代理介入了某条请求,可能会引发破坏性的行为,而且会造成安全漏洞
306 (未使用) : 当前未使用
307 Temporary Redirect : 与301状态码类似;但客户端应该使用Location 首部给出的URL来临时定位资源。将来的请求应该使用老的URL
400 Bad Request : 用于告知客户端它发送了一个错误的请求 401 Unauthorized 与适当的首部一同返回,在这些首部中请求客户端在获取对资源的访问权之前,对自己进行认证。更多有关认证的内容请参见 12.1节
402 Payment Required : 现在这个状态码还未使用,但已经被保留,以作未来之用 403 Forbidden 用于说明请求被服务器拒绝了。如果服务器想说明为什么拒绝请求,可以包含实体的主体部分来对原因进行描述。但这个状态码通常是在服务器不想说明拒绝原因的时候使用的 404 Not Found 用于说明服务器无法找到所请求的URL。通常会包含一个实体,以便客户端应用程序显示给用户看
405 Method Not Allowed : 发起的请求中带有所请求的URL不支持的方法时,使用此状态码。应该在响应中包含Allow首部,以告知客户端对所请求的资源可以使用哪些方法。
500 Internal Server Error : 服务器遇到一个妨碍它为请求提供服务的错误时,使用此状态码 501 Not Implemented 客户端发起的请求超出服务器的能力范围(比如,使用了服务器不支持的请求方法)时,使用此状态码
502 Bad Gateway : 作为代理或网关使用的服务器从请求响应链的下一条链路上收到了一条伪响应(比如,它无法连接到其父网关)时,使用此状态码
通用信息性首部
首部
|
描述
|
Connection
|
允许客户端和服务器指定与请求/响应连接有关的选项
|
Date
|
提供日期和时间标志,说明报文是什么时间创建的
|
MIME-Version
|
给出了发送端使用的MIME版本
|
Trailer
|
如果报文采用了分块传输编码(chunked transfer encoding)方式,就可以用这个首部列出位于报文拖挂(trailer)部分的首部集合
|
Transfer-Encoding
|
告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式
|
Update
|
给出了发送端可能想要“升级”使用的新版本或协议
|
Via
|
显示了报文经过的中间节点(代理、网关)
|
Cache-Control
|
用于随报文传送缓存指示
|
Pragma
|
另一种随报文传送指示的方式,但并不专用于缓存
|
请求信息性首部
Client-IP4
|
提供了运行客户端的机器的IP地址
|
From
|
提供了客户端用户的E-mail地址
|
Host
|
给出了接收请求的服务器的主机名和端口号
|
Referer
|
提供了包含当前请求URI的文档的URL
|
UA-Color
|
提供了与客户端显示器的显示颜色有关的信息
|
UA-CPU
|
给出了客户端CPU的类型或制造商
|
UA-Disp
|
提供了与客户端显示器(屏幕)能力有关的信息
|
UA-OS
|
给出了运行在客户端机器上的操作系统名称及版本
|
UA-Pixels
|
提供了客户端显示器的像素信息
|
User-Agent
|
将发起请求的应用程序名称告知服务器
|
Authorization
|
包含了客户端提供给服务器,以便对其自身进行认证的数据
|
Cookie
|
客户端用它向服务器传送一个令牌——它并不是真正的安全首部,但确实隐含了安全功能
|
请求喜好与能力首部(ACCEPT首部)
Accept 首部为客户端提供了一种将其喜好和能力告知服务器的方式,包括它们想要什么,可以使用什么,以及最重要的,它们不想要什么。这样,服务器就可以根据这些额外信息,对要发送的内容做出更明智的决定。
Accept
|
告诉服务器能够发送哪些媒体类型
|
Accept-Charset
|
告诉服务器能够发送哪些字符集
|
Accept-Encoding
|
告诉服务器能够发送哪些编码方式
|
Accept-Language
|
告诉服务器能够发送哪些语言
|
TE
|
告诉服务器可以使用哪些扩展传输编码
|
请求条件首部
有时客户端希望为请求加上某些限制。比如,如果客户端已经有了一份文档副本,就希望只在服务器上的文档与客户端拥有的副本有所区别时,才请求服务器传输文档。通过条件请求首部,客户端就可以为请求加上这种限制,要求服务器在对请求进行响应之前,确保某个条件为真。
Expect
|
允许客户端列出某请求所要求的服务器行为
|
If-Match
|
如果实体标记与文档当前的实体标记相匹配,就获取这份文档
|
If-Modified-Since
|
除非在某个指定的日期之后资源被修改过,否则就限制这个请求
|
If-None-Match
|
如果提供的实体标记与当前文档的实体标记不相符,就获取文档
|
If-Range
|
允许对文档的某个范围进行条件请求
|
If-Unmodified-Since
|
除非在某个指定日期之后资源没有被修改过,否则就限制这个请求
|
Range
|
如果服务器支持范围请求,就请求资源的指定范围
|
请求代理首部
Max-Forward
|
在通往源端服务器的路径上,将请求转发给其他代理或网关的最大次数——与TRACE方法一同使用
|
Proxy-Authorization
|
与Authorization 首部相同,但这个首部是在与代理进行认证时使用的
|
Proxy-Connection
|
与Connection 首部相同,但这个首部是在与代理建立连接时使用的
|
响应信息性首部
Age
|
(从最初创建开始)响应持续时间12
|
Public
|
服务器为其资源支持的请求方法列表
|
Retry-After
|
如果资源不可用的话,在此日期或时间重试
|
Server
|
服务器应用程序软件的名称和版本
|
Title
|
对HTML文档来说,就是HTML文档的源端给出的标题
|
Warning
|
比原因短语中更详细一些的警告报文
|
响应协商首部
如果资源有多种表示方法——比如,如果服务器上有某文档的法语和德语译稿,HTTP/1.1 可以为服务器和客户端提供对资源进行协商的能力。
Accept-Ranges
|
对此资源来说,服务器可接受的范围类型
|
Vary
|
服务器查看的其他首部的列表,可能会使响应发生变化;也就是说,这是一个首部列表,服务器会根据这些首部的内容挑选出最适合的资源版本发送给客户端
|
响应安全首部
Proxy-Authenticate
|
来自代理的对客户端的质询列表
|
Set-Cookie
|
不是真正的安全首部,但隐含有安全功能;可以在客户端设置一个令牌,以便服务器对客户端进行标识
|
Set-Cookie2
|
与Set-Cookie 类似,RFC 2965 Cookie定义
|
WWW-Authenticate
|
来自服务器的对客户端的质询列表
|
实体信息性首部
Allow
|
列出了可以对此实体执行的请求方法
|
Location
|
告知客户端实体实际上位于何处;用于将接收端定向到资源的(可能是新的)位置(URL)上去
|
实体内容首部
Content-Base
|
解析主体中的相对URL时使用的基础URL
|
Content-Encoding
|
对主体执行的任意编码方式
|
Content-Language
|
理解主体时最适宜使用的自然语言
|
Content-Length
|
主体的长度或尺寸
|
Content-Location
|
资源实际所处的位置
|
Content-MD5
|
主体的MD5校验和
|
Content-Range
|
在整个资源中此实体表示的字节范围
|
Content-Type
|
这个主体的对象类型
|