HTTP/2相比于HTTP/1,大幅度的提升了web性能。在与HTTP/1完全语义兼容的基础上,进一步减少了网络延迟
1、头部压缩
HTTP/1可以用头字段“Content-Encoding”指定Body的编码方式,比如用gzip压缩来节约带宽,但报文的Header并不支持压缩;HTTP/2使用了专门为头部压缩而设计的HPACK算法
HPACK算法是一个有状态的算法,需要客户端和服务器各自维护一份索引表,也可以说是字典,压缩和解压缩就是查表和更新表的操作。为了方便管理和压缩,HTTP/2废除了原有的起始行概念,把起始行里面的请求方法、URI、状态码等统一转发成了头字段的形式,这些”不是头字段的头字段“成为伪头字段。而起始行里的版本号和错误原因短语因为没什么大用,顺便也给废除了
为了与“真头字段”区分开,这些伪头字段会在名字前加一个:
,比如“:authority”、“:method”、“:status”分别表示的是域名、请求方法和状态码
HTTP报文头就全都是Key-Value形式的字段,于是HTTP/2就为一些最常用的头字段定义了一个只读的静态表
下图中列出了静态表的一部分,这样只要查表就可以知道字段名和对应的值,比如数字2代表GET,数字8代表状态码200
如果表里只有Key没有Value,或者是自定义字段根本找不到就需要用到动态表,它添加再静态表后面,结构相同,但会在编码解码的时候随时更新。比如,第一次发送请求时的“user-agent”字段长时一百多个字节,用哈夫曼压缩编码发送之后,客户但和服务器都更新自己的动态表,添加一个新的索引号65.那么下一次发送的时候就不用再重复发那么多字节了,只要用一个字节发送编号就好
随着在HTTP/2连接上发送的报文越来越多,两边的字典也会越来越丰富,最终每次的头部字段都会变成一两个字节的代码,原来上千字节的头用几十个字节就可以表示了,压缩效果比gzip要好很多
2、二进制格式
HTTP/2把原来的“Header+Body”的消息打散为数个小片的二进制帧,用HEADERS帧存放头数据、DATA帧存放实体数据
HTTP/2的帧结构有点类似TCP的段或者TLS里的记录,但报头很小,只有9字节,非常地节省
帧开头是3个字节的帧长度,默认上限是
2
14
2^{14}
214,最大是
2
24
2^{24}
224,也就是说HTTP/2的帧通常不超过16K,最大是16M
长度后面的一个字节是帧类型,大致可以分成数据帧和控制帧两类,HEADERS帧和DATA帧属于数据帧,存放的是HTTP报文,而SETTINGS、PING、PRIORITY等则是用来管理流的控制帧
第5个字节是帧标志信息,可以保存8个标志位,携带建单的控制信息。常用的标志位有END_HEADERS表示头数据结束,相当于HTTP/1里头后的空行,END_STREAM表示单方向数据发送结束,相当于HTTP/1里Chunked分块结束标志
报文头里最后4个字节是流标识符,也就是帧所属的流,接收方使用它就可以从乱序的帧里识别出具有相同流ID的帧序列,按顺序组装起来就实现了虚拟的流
3、虚拟的流
HTTP/2定义了一个流的概念,它是二进制帧的双向传输序列,同一个消息往返的帧会分配一个唯一的流ID。可以想象成一个虚拟的数据流,在里面流动的是一串有先后顺序的数据帧,这些数据帧按照次序组装起来就是HTTP/1里的请求报文和响应报文
因为流是虚拟的,实际上并不存在,所以HTTP/2就可以在一个TCP连接上用流同时发送多个碎片化的消息,这就是常说的多路复用——多个往返通信都复用一个连接来处理
在流的层面上,消息是一些有序的帧序列,而在连接的层面上,消息却是乱序收发的帧。多个请求/响应之间没有了顺序关系,不需要排队等待,也就不会再出现队头阻塞问题,降低了延迟,大幅度提高了连接的利用率
为了更好地利用连接,加大吞吐量,HTTP/2还添加了一些控制帧来管理虚拟的流,实现了优先级和流量控制,这些特性也和TCP协议非常相似
HTTP/2还在一定程度上改变了传统的请求-应答工作模式,服务器不再是完全被动地响应请求,也可以新建流主动向客户端发送消息。比如,在浏览器刚请求HTML的时候就提前把可能会用到的JS、CSS文件发给客户端,减少等待的延迟,这被称为服务端推送
HTTP/2流的特点:
- 流是可并发的,一个HTTP/2连接上可以同时发出多个流传输数据,也就是并发多请求,实现多路复用
- 客户端和服务端都可以创建流,双方互不干扰
- 流是双向的,一个流里面客户端和服务端都可以发送或接收数据帧,也就是一个请求-应答来回
- 流之间没有固定关系,彼此独立,但流内部的帧是由严格顺序的
- 流可以设置优先级,让服务器优先处理,比如先传HTML/CSS,后传图片,优先用户体验
- 流ID不能重用,只能顺序递增,客户端发起的ID是奇数,服务端发起的ID是偶数
- 在流上发送RST_STREAM帧可以随时终止流,取消接收或发送
- 第0号流比较特殊,不能关闭,也不能发送数据帧,只能发送控制帧,用于流量控制
4、强化安全
HTTP/2分为加密和明文两个不同的版本,HTTP/2协议定义了两个字符串标识符:h2表示加密的HTTP/2,h2c表示明文的HTTP/2,而且加密版本的HTTP/2在安全方面做了强化,要求下层的通信协议必须是TLS1.2以上
5、协议栈
HTTP/2是建立在HPack、Stream、TLS1.2基础之上的