图解HTTP读书笔记(三)

图解HTTP读书笔记(三)

第三章 HTTP报文内的HTTP信息

HTTP报文

HTTP报文:用于HTTP协议交互的信息。请求端的HTTP报文叫做请求报文,响应端的叫做响应报文。

HTTP报文本身是由多行数据构成的字符串文本。

请求报文与响应报文结构

我们来看下请求报文和响应报文的结构
image

image

请求报文和响应报文的首部内容由一下数据组成。
- 请求行:包含用于请求的方法,请求URI和HTTP版本。
- 状态行:包含表明响应的结果的状态码。原因短语和HTTP版本。
- 首部字段:包含表示请求和响应的各种条件和属性的各类首部。
一般有4种首部,分别是:通用首部,请求首部,响应首部,实体首部。
- 其他:可能包含HTTP的RFC里未定义的首部(如:Cookie等)。

RFC百科

报文主体与实体主体
  • 报文主体:是HTTP通信中的基本单位,由8位组字节流组成,通过HTTP通信传输。
  • 实体主体:作为请求或响应的有效载荷数据(补充项)被传输,其内容由实体首部和实体主体组成。

HTTP报文的主体用于传输请求或响应的实体主体。

通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异。

编码&分块传输

HTTP在传输数据时可以按照数据原貌直接传输,但也可以在传输过程中通过编码来提升传输速率。但是,编码的操作需要计算机来完成,因此会消耗更多的CPU资源。

  • 压缩传输的内容编码

HTTP协议中内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压缩。内容编码后的实体由客户端接收并负责解码。

image

常用的内容编码:
1. gzip(GNU zip)
2. compress(UNOX系统的标准压缩)
3. deflate(zlib)
4. identity(不进行编码)

  • 分割发送的分块传输编码

在HTTP通信过程中,请求的编码实体资源尚未全部传输完成之前,浏览器无法显示请求页面。在传输大量容量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。这种把实体主体分块的功能成为分块传输编码。

image

分块传输编码会将实体主体分成多个部分(块)。每一块都会用十六进制来标记块的大小,而实体主体的最后一块会使用“0(CR+LF)”来标记。

使用分块传输编码的实体主体会由接收的客户端负责解码,恢复到编码前的实体主体。

HTTP/1.1中存在一种称为传输码(Transfer Coding)的机制,他可以在通信时按某种编码方式传输,但只定义作用于分块传输编码中。

发送多种数据的多部分对象集合(Multipart)

发送邮件时,我们可以在邮件里写入文字并添加多分附件,这是因为采用MIME机制。

MIME(Multipurpose Internet Mail Extension):多用途因特网邮件扩展机制。它允许邮件处理文本、图片、视频等多个不同类型的数据。在MIME扩展中会使用一种称为多部分对象集合(Multipart)的方法,来容纳多份不同类型的数据。

在HTTP协议中采纳了多部分对象的集合,发送的一份报文主体内可含有多类型实体。通常是在图片或文本文件等上传时使用

多部分对象集合的对象如下:
- multipart/form-data:在web表单上传时使用

boundary:表示分隔符

image

  • multipart/byteranges:状态码206(Partial Content,部分内容)响应报文包含了多个范围的内容时使用。

image

在HTTP报文中使用多部分对象集合时,需要在首部字段里加上Content-type。有关这个首部字段,后面章节讲解。

使用boundary字符串来划分多部分对象集合指明的各类实体。如:以“–ABC”开始,以“–ABC–”结束。

多部分对象集合的每个部分的类型中,都可以含有首部字段。另外,可以在某个部分中嵌套使用多部分对象集合。
有关多部分对象集合更详细的解释,请参考RFC2046

获取部分内容的范围请求

以前,用户宽带不好,下载稍大的文件非常吃力,如果下载过程中遇到网络中断,需要重新开始,为了解决这一个问题,需要一种可恢复的机制。也就是可以重之前下载中断处恢复下载(断点下载)。

要实现该功能需要指定下载的实体范围。像这样,指定范围发送的请求叫做范围请求(Range Request)。

对一份10000字节大小的资源,如果使用范围请求,可以只有请求5001-10000字节内的资源。

image

执行范围请求时,会用到首部字段Range来指定资源的byte范围。

byte范围的指定形式:
- 5001-10000字节

Range:bytes=5001-10000
  • 5001字节之后的全部字节
Range:bytes=5001-
  • 从一开始到3000,5000-7000字节的多重范围
Range:bytes= -3000,5000-7000

针对范围请求,响应会返回状态码206。另外响应会在Content-Type标明multipart/byteranges后返回响应报文。

内容协商机制(返回最适合的内容)

当浏览器的默认语言为英语或中文,访问相同的URI的web页面时,会显示对应的英文或中文版的网页。这样机制称为内容协商(Content Negotiation)。

内容协商机制是指客户端和服务端就响应的资源内容进行交涉,然后提供给客户端最为适合的资源。内容协商会以响应资源的语言,字符集,编码方式等作为判断的基准。

包含在请求报文中的某些首部字段(如下)就是判断的基准。详情在后面说明。
- Accept
- Accept-Charset
- Accept-Encoding
- Accept-Language
- Content-Language

内容协商技术有3中类型:服务器驱动协商,客户端驱动协商,透明协商。

  • 服务驱动协商:有服务端进行内容协商,以请求的首部字段为参考,在服务器端自动处理。但对于用户来说,以浏览器发送的信息作为判定的依据,并不一定能筛选出最优内容。
  • 客户端驱动协商:有客户端进行内容的协商,用户从浏览器显示的可选项列表中手动选择。还可以利用javascript脚本在web页面上自动进行上述选择。如:自定切换成PC版或手机版。
  • 透明协商:是服务器和客户端驱动的结合体,是由服务器端和客户端各自进行内容协商的一种方法。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值