HTTP通信过程包括从客户端发往服务端的请求以及服务端返回客户端的响应。
HTTP报文
用于HTTP协议交互的信息被称为HTTP报文。请求端(客户端)的HTTP报文叫做请求报文,响应端(服务端)的叫做响应报文。HTTP报文本身是由多行数据构成的字符串文本。
HTTP报文大致可以分为报文首部和报文主体两块。两者由最初出现的空行(CR+LF)来划分
请求报文以及响应报文的结构
请求报文(上)以及响应报文(下)的结构
请求报文(上)以及响应报文(下)的实例
请求报文和相应报文的首部内容由一下数据组成。
请求行
包含用于请求的方法,请求URI和HTTP版本
状态行
包含表明相应结果的状态码
首部字段
包含表示请求和相应的各种条件和属性的各类首部
一般有四种首部,分别是:通用首部,请求首部,响应首部和实体首部
其他
可能包含HTTP和RFC里未定义的首部(Cookie等)
编码提升传输速率
HTTP在传输数据时可以按照数据原貌直接传输,但也可以在传输过程中通过编码提升传输速率。通过在传输时编码,能有效地处理大量的访问请求。但是编码的操作需要计算机来完成,因此会消耗更多的CPU资源。
报文主体和实体主体的差异
报文
是HTTP通信中的基本单位,由8位组字节流组成,通过HTTP通信传输。
实体
作为请求或相应的有效载荷数据被传输,其内容由实体首部和实体主体组成。
HTTP报文的主体用于传输请求或响应的实体主体。
通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异。
压缩传输的内容编码
内容编码致命应用在实体内容上的编码格式,并保持实体信息原样压缩。内容编码后的实体有客户端接收并负责解码。
常用的内容编码有以下几种:gzip,compress,deflate,identity
分割发送的分块传输编码
在HTTP通信过程中,请求的编码实体资源尚未全部传输完成之前,浏览器无法显示请求页面。在传输大容量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。
这种把实体主体分块的功能成为分块传输编码。实体主体的最后一块会使用0(CR+LF)来标记。分块还是由接受的客户端负责解码。
发送多种数据的多部分对象集合
HTTP协议中也采纳了多部分对象集合,发送的一份报文主体可含有多类型实体。通常是在图片或者文本文件等上传时使用。
multipart/form-data:在web表单上传时使用
multipart/byteranges:状态码206响应报文包含了多个范围的内容时使用
在HTTP报文中使用多部分对象集合时,需要再首部字段加上Content-type。
获取部分内容的范围请求
以前用户不能使用现在这种高速带宽访问互联网,访问一个过大的图片时就很吃力了。如果下载中遇到网络中断,那就必须重头再来了。为了解决这个问题,需要一种可恢复的机制(断点续传)。
要实现该功能需要指定下载的实体范围。像这样,指定范围发送的请求叫做范围请求。
内容协商返回最合适的内容
同一个Web页面可能存在着多分相同内容的页面。比如英文和中文版的web页面,内容虽然相同,但使用的语言却不同。当浏览器默认为中文是,访问URI时,则对应中文web页面。这样的机制叫做内容协商。
内容协商机制:客户端和服务端就响应的资源内容进行交涉,然后提供给客户端最为适合的资源。内容协商会以响应资源的语言、字符集、编码方式等作为判断的基准。
内容协商技术有以下3种类型,
服务器驱动协商:由服务端进行内容协商。以请求的首部字段为参考,服务端自动处理。
客户端驱动协商:由客户端进行内容协商的方式。用户从浏览器显示的可选项列表中手动选择。
透明协商:是服务器驱动和客户端驱动的结合体,是由服务端和客户端各自进行内容协商的一种方法。