三、HTTP报文内的信息
- HTTP报文及其结构
用于HTTP协议交互的信息被称为HTTP报文。HTTP报文是由多行(用CR+LF作换行符)数据构成的字符串文本。HTTP报文由报文首部和报文主体组成,但报文主体并不是必须的。
客户端发送的报文叫请求报文,服务端发送的报文叫响应报文。请求报文的首部包括请求行、请求首部字段、通用首部字段和实体首部字段等;响应报文的首部包括状态行、响应首部字段、通用首部字段和实体首部字段等。
报文是HTTP通信中的基本单位,由8为组字节流组成;实体则作为请求或响应的有效载荷数据(补充项)被传输,其内容由实体首部和实体主体组成。HTTP报文的主体用于传输请求或响应的实体主体。通常情况下,报文主体等于实体主体,只有当传输中进行编码操作时,实体主体的内容会发生变化,才导致它和报文主体产生差异。 - 编码提升传输速率
HTTP协议通过在传输过程中对信息进行编码以提高传输速率。HTTP协议中有一种被称为内容编码的功能,可以进行类似压缩文件的操作。内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压缩。内容编码后的实体有客户端接收并负责解码。常见的内容编码有以下几种:
gzip(GNU zip)
compress(UNIX系统的标准压缩)
deflate(zlib)
identity(不进行编码)
此外,在传输大容量数据时,HTTP通常把数据分割成许多块,让浏览器逐步显示页面,这种把实体主体分块的功能成为分块传输编码。分块传输编码会将实体主体分成多个块,每一块都会用十六进制标记块的大小,而实体主体的最后一块将会用CR+LF标记。
HTTP中采用多部分对象集合,使得发送的一份报文主体中可以包括图片、音频和视频等多种类型实体。多部分对象集合包含的对象如下:
multipart/form-data,通常在Web表单文件上传时使用
multipart/byteranges,状态码206响应报文包含了多个范围的内容时使用 - 获取部分内容的范围请求
指定范围发送的请求叫做范围请求。比如,对于一份10000字节大小的资源,我们通过使用范围请求,可以只请求1~5000字节内的资源。执行范围请求时,会用到首部字段Range来指定资源的byte范围。
针对范围请求,响应会返回状态码为206 Partial Content的响应报文。如果服务器无法响应范围请求,则会返回状态码200 OK 和完整的实体内容。 - 内容协商返回最合适的内容
内容协商机制是指客户端和服务器就响应的资源内容进行交涉,然后提供给客户端最为适合的资源。比如说,同一个网站可能有中文和英文两种页面,当浏览器默认的语言为中文时,访问网站时会显示中文界面;而当浏览器的默认语言为英文时,网站则会显示英文界面。内容协商会以响应资源的语言、字符集、编码方式等作为判断的依据。内容协商技术有以下3种类型:
服务器驱动协商
客户端驱动协商
透明协商