HTTP 报文内的 HTTP 信息
HTTP 报文
报文是由多行(用CR+LF作为换行符)数据构成的字符串文本
请求报文及响应报文的结构
- 请求行:包含用于请求的方法,请求URI和HTTP版本
- 状态行:包含表明响应结果的状态码,原因短语和HTTP版本
- 首部字段:包含表示请求和响应的各种条件和属性的各类首部
一般有4种首部:通用首部,请求首部,响应首部和实体首部 - 其他:可能包含HTTP的RFC里未定义的首部(Cookie 等)
编码提升传输速率
- 可以按照数据原貌直接传输,也可以在传输过程中通过编码提升传输效率。编码操作需要计算机来完成,因此会消耗更多CPU资源
报文主体和实体主体的区别
- 报文: 是HTTP通信中的基本单位,由8位组字节流组成,通过HTTP通信传输
- 实体:作为请求或响应的有效载荷数据(补充项)被传输,其内容由实体首部和实体主体组成
- HTTP报文的主体用于传输请求或响应的实体主体
- 通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异
压缩传输的内容编码
- 内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压缩。内容编码后的实体由客户端接收并负责解码
- 常见内容编码
gzip(GNU zip)
compress(UNIX 标准压缩)
deflate (zlib)
identity(不进行编码)
分割发送的分块传输编码
- 在HTTP通信过程中,请求的编码实体资源尚未全部传输完成之前,浏览器无法显示请求页面。在传输大容量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。
- 这种把实体主体分块的功能成为分块传输编码(Chunked Transfer Coding)
- 在HTTP/1.1中存在一种成为传输编码(Transfer Coding)的机制,它可以在通信时按某种编码方式传输,但只定义作用于分块传输编码中。
发送多种数据的多部分对象集合
- 邮件中可以写入文字并添加多份附件。是因为采用了MIME(Multipurpose Internet Mail Extensions,多用途因特网邮件扩展)机制,它允许邮件处理文本、图片、视频等多个不同类型的数据。
- MIME扩展中会使用一种成为多部分对象集合(Multipart)的方法,来容纳多份不同类型的数据
- HTTP协议中也采用了多部分对象集合,发送的一份报文主体内可含有多类型实体。通常是在图片或文本文件等上传时使用
- 多部分对象集合包含的对象如下
- 需要使用多部分对象集合时,需要在首部字段里加上Content-Type
- boundary 用来划分多部分对象集合致命的各类实体。
在boundary字符串指定的各个实体的起始行之前插入"–“标记,在多部分对象集合对应的字符串的最后插入”–"标记,作为结束。
获取部分内容的范围请求
- 用首部字段Range来指定资源的byte范围
- 如果服务器端无法响应范围请求,则会返回状态码200 OK 和完整的实体内容
内容协商返回最适合的内容
- 当浏览器的默认语言为英语或中文,访问相同 URI 的 Web 页面时, 则会显示对应的英语版或中文版的 Web 页面。这样的机制称为内容 协商(Content Negotiation)。
- 内容协商机制是指客户端和服务器端就响应的资源内容进行交涉,然 后提供给客户端最为适合的资源。内容协商会以响应资源的语言、字 符集、编码方式等作为判断的基准。
- 在请求报文中的某些首部字段就是判断的标准
- Accept
- Accept-Charset
- Accept-Encoding
- Accept-Language
- Content-Language
- 内容协商技术三种类型
- 服务器驱动协商(Server-driven Negotiation)
- 客户端驱动协商(Agent-driven Negotiation)
如:列表选择 - 透明协商(Transparent Negotiation)