HTTP学习记录(六-2)HTTP首部

                             第六章 HTTP首部

上一篇:HTTP学习记录(六-1)HTTP首部

下一篇:HTTP学习记录(六-3)HTTP首部

4、请求首部字段

请求首部字段是从客户端往服务器端发送请求报文中所使用的字段,用于补充请求的附加信息、客户端信息、对响应内容相关的优先级等内容。

(1)Accept

Accept首部字段可通知服务器,用户代理能够处理的媒体类型及媒体类型的相对优先级。可使用type/subtype这种形式,一次指定多种媒体类型。下面列举几个媒体类型的例子:

若要给显示的媒体类型增加优先级,则使用q= 来额外表示权重值,用分号进行分隔。权重值q的范围是0~1(可精确到小数点后3位),且1为最大值。不指定权重Q值时,默认权重q=1.0。当服务器提供多种内容时,将会返回权重值最高的媒体类型。

(2)Accept-Charset

Accept-Charest首部字段可用来通知服务器用户代理支持的字符集及字符集的相对优先顺序。另外,可一次性指定多种字符集。与首部字段Accept相同的是可用权重Q值来表示相对优先级。该首部字段应用于内容协商机制的服务器驱动协商。

(3)Accept-Encoding

Accept-Encoding首部字段用来告知服务器用户代理支持的内容编码及内容编码的优先级顺序。可一次性指定多种内容编码。下面列举几个内容编码的例子:

采用权重Q值来表示相对优先级,这点与首部字段Accept相同。另外,也可使用星号(*)作为通配符,指定任意的编码格式。

(4)Accept-Language

首部字段Accept-Language用来告知服务器用户代理能够处理的自然语言集(指中文或英文等),以及自然语言集的相对优先级。可一次指定多种自然语言集。和Accept首部字段一样,按权重值Q来表示相对优先级。在上述图例中,客户端在服务器有中文版资源的情况下,会请求其返回中文版对应的响应,没有中文版时,则会请求返回英文版响应。

(5)Authorization

首部字段Authorization是用来告知服务器,用户代理的认证信息(证书值)。通常,想要通过服务器认证的用户代理会在接收到返回的401状态码响应后,把首部字段Authorization加入请求中。共用缓存在接收到含有Authorization首部字段的请求时的操作处理会略有差异。

(6)Expect

客户端使用首部字段Expect来告知服务器,期望出现的某种特定行为。因服务器无法理解客户端的期望做出回应而发生错误时,会返回状态码417 Expectation Failed。客户端可以利用该首部字段,写明所期望的扩展。虽然http/1.1规范只定义了100-continue(状态码100 Continue之意)。

等待状态码100响应的客户端在发生请求时,需要指定Expect:100-continue。

(7)From

首部字段from用来告知服务器使用用户代理的用户的电子邮件地址。通常,其使用目的就是为了显示搜索引擎等用户代理的负责人的电子邮件联系方式。使用代理时,应尽可能包含From首部字段(但可能会因代理不同,将电子邮件地址记录在User-Agent首部字段内)。

(8)Host

首部字段Host会告知服务器,请求的资源所处的互联网主机名和端口号。Host首部字段在HTTP/1.1规范内是唯一一个必须被包含在请求内的首部字段 。首部字段Host和以单台服务器分配多个域名的虚拟主机的工作机制有很密切的关联,这是首部字段Host必须存在的意义。

请求被发送至服务器时,请求中的主机名会用IP地址直接替换解决。但如果这时,相同的IP地址下部署运行着多个域名,那么服务器就会无法理解究竟是哪个域名对应的请求。因此,就需要使用首部字段Host来明确指出请求的主机名。如服务器为设定主机名,那直接发送一个空值即可。

(9)If-Match

形如if-XXX这种形式的请求字段,都可以成为条件请求。服务器接收到附带条件的请求后,只能判断指定条件为真时,才会执行请求。

首部字段If-Match,属附带条件之一,她会告知服务器匹配资源所用的实体标记(ETag)值。这时的服务器无法使用弱ETag值。服务器会比对If-Match的字段值和资源的ETag值,仅当两者一致时,才会执行请求。反之,则返回状态码412 Precondition Failed的响应。

还可以使用星号(*)指定If-Match的字段值。针对这种情况,服务器将会忽略ETag的值,只要资源存在就处理请求。

(10)If-Modified-Since

首部字段IF-Modified,属附带条件之一,它会告知服务器若If-Modified-Since字段值早于资源的更新时间,则希望能处理该请求。而在指定If-Modified-Since字段值的日期时间之后,如果请求的资源都没有过更新,则返回状态码304 Not Modified的响应。

If-Modified-Since用于确认代理或客户端拥有的本地资源的有效性。获取资源的更新日期时间,可通过确认首部字段Last-Modified来确定。

(11)If-None-Match

首部字段If-None-Match,属附带条件之一。它和首部字段If-Match作用相反。用于指定If-None-Match的字段值的实体标记(ETag)和请求资源的ETag值不一致时,它就会告知服务器处理该请求。在GET或HEAD方法中使用首部字段If-None-Match可获取最新的资源。因此,这与使用首部字段If-Modified-Since对有些类似。

(12)IF-Range

首部字段IF-Range属于附带条件之一。它告知服务器若指定的IF-Range字段值(ETag值或者时间)和请求资源的ETag值或时间相一致时,则作为范围请求处理。反之,则返回全体资源。

下面我们思考一下不使用首部字段IF-Range发送请求的情况。服务器端的资源如果更新,那客户端持有资源中的一部分也会随之无效,当然,范围请求作为前提是无效的。这时,服务器会暂且以状态码412 Precondition Failed 作为响应返回,其目的是催促客户端再次发送请求。这样一来,与使用首部字段IF-Range比起来,就需要花费两倍的功夫。

(13)IF-Unmodified-Since

首部字段IF-Unmodified-Since和首部字段IF-Modified-Since的作用相反。它的作用是告知服务器,指定的请求资源只有在字段值内指定的日期时间之后,为发生更新的情况下,才能处理请求。如果在指定日期时间之后发生了更新,则以状态码412 Precondition Failed作为响应返回。

(14)Max-Forwards

通过TRACE方法或OPTION方法,发送包含首部字段Max-Forwards的请求时,该字段以十进制整数形式指定可经过的服务器最大数目。服务器在往下一个服务器转发之前,MAx-Forwards的值减一重新赋值。当服务器收到Max-Forwards的值为0的请求时,则不再进行转发,而是直接返回响应。

使用HTTp协议通信时,请求可能会经过代理等多台服务器。途中,如果代理服务器由于某些原因导致请求转发失败,客户端也就等不到服务器返回的响应了。对此,我们无从可知。可以灵活使用首部字段Max-Forwards,针对以上问题产生的原因展开调查。由于当Max-Forwards字段值围0时,服务器就会立即返回响应,由此我们至少可以对以那台服务器为终点的传输路径的通信情况有所把握。

(15)Proxy-Authorization

接收到从代理服务器发来的认证质询时,客户端会发送包含首部字段Proxy-Authorization的请求,以告知服务器认证所需要的信息。这个行为是与客户端和服务器之间的HTTp访问认证相类似的,不同之处在于,认证行为发生在客户端和代理之间。客户端与服务器之间的的认证,使用首部字段Authorization可起到相同作用。

(16)Range

对于只需获取部分资源的范围请求,包含首部字段Range即可告知服务器资源的指定范围。接收到附带Range首部字段请求的服务器,会在处理请求之后返回状态码206 PartialContent的响应。无法处理该范围请求时,会返回状态码200 OK的响应及全部资源。

(17)Referer

首部字段Referer会告知服务器请求的原始资源URI。客户端一般会发送Referer首部字段给服务器。但当直接在浏览器的地址栏输入URI,或出于安全性的考虑时,也可以不发送该首部字段。因为原始资源的URI中的查询字符串可能含有ID和密码等保密信息,要是写进Referer转发给其他服务器,则可能导致保密信息的泄露。

(18)TE

首部字段TE会告知服务器客户端能够处理响应的传输编码方式及相对优先级。它和首部字段Accept-Encoding的功能很相像,但是用于传输编码。首部字段TE除指定传输编码之外,还可以指定伴随trailer字段的分块传输编码的方式。应用后者时,只需把trailers赋值给该字段值。

(19)User-Agent.

首部字段User-Agent会将创建请求的浏览器和用户代理名称等信息传达给服务器。由网络爬虫发起请求时,有可能会在字段内添加爬虫作者的电子邮件地址。此外,如果请求经过代理,那么中间也很可能被添加上代理服务器的名称。

5、响应首部字段

响应首部字段是由服务器端向客户端返回响应报文中所使用的字段,用于补充响应的附加信息、服务器信息,以及对客户端的附加要求等信息。

(1)Accept-Ranges

首部字段Accept-Ranges是用来告知客户端服务器是否能处理范围请求,以指定获取服务器端某个部分的资源。可指定的字段值有两种,可处理范围请求时指定其为bytes,反之则指定其为none。

(2)Age

首部字段Age能告知客户端,源服务器在多久前创建了响应。字段值的单位为秒。若创建该响应的服务器是缓存服务器,Age值是指缓存后的响应再次发起认证到认证完成的时间值。代理创建响应时必须加上首部字段Age。

(3)ETag

首部字段ETag能告知客户端实体标识。它是一种可将资源以字符串形式做唯一标识的方式。服务器会为每份资源分配对应的ETag值。另外,当资源更新时,Etag值也需要更新。生成ETag值时,并没有统一的算法规则,而仅仅是由服务器来分配。

资源被缓存时,就会被分配唯一性标识。比如中英版网页对应的资源,两者对应的URI是相同的,所以仅凭URI指定缓存的资源是相当困难的。若在下载过程中出现连接中断、再连接的情况,都会依照ETag值来指定资源。

强ETag值:不论实体发生多么细微的变化都会改变其值。

弱ETag值:只用于提示资源是否相同。只有资源发生了根本改变,产生差异时才会改变ETag值。这时,会在字段值最开始处附加W/。

(4)Location

使用首部字段Location可以将响应接收方引导至某个与请求URI位置不同的资源。基本上,该字段会配合3XX:Redirection的响应,提供重定向的URI。几乎所有的浏览器在接收到包含首部字段LOcation的响应后,都会强制性的尝试对已提示的重定向资源的访问。

(5)Proxy-Authenticate

首部字段Proxy-Authenticate会把由代理服务器所要求的认证信息发送给客户端。它与客户端和服务器之间的HTTP访问认证的行为相似,不同之处在于其认证行为是在客户端和代理之间进行的。而客户端与服务器之间进行认证时,首部字段www-Authorization有着相同的作用。

(6)Retry-After

首部字段Retry-After告知客户端应该在多久之后再次发送请求。主要配合状态码503 Service Unavailable响应,或3XX Redirect响应一起使用。字段值可以指定为具体的日期时间,也可以是创建响应后的秒数。

(7)Server

首部字段Server告知客户端当前服务器上安装的HTTP服务器应用程序的信息。不单单会标出服务器上的软件应用名称,还有可能包括版本号和安装时启用的可选项。

(8)Vary

首部字段Vary可对缓存进行控制。源服务器会像代理服务器传达关于本地缓存使用方法的命令。从代理服务器接收到源服务器返回包含Vary指定项的响应之后,若在要进行缓存,仅对请求中含有相同Vary指定首部字段的请求返回缓存。即使对相同的资源发起请求,但由于Vary指定的首部字段不同,因此必须要从源服务器重新获取资源。

(9)WWW-Authenticate

首部字段WWW-Authenticate用于HTTP访问认证。它会告知客户端用于访问请求URI所指定资源的认证方案和带参数提示的质询。状态码401 Unauthorized响应中,肯定带有首部字段WWW-Authenticate。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

皓月星辰_w

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值