Go发起HTTP2.0请求流程分析(后篇)——标头压缩

最新推荐文章于 2024-05-13 10:18:53 发布

Gopher指北

最新推荐文章于 2024-05-13 10:18:53 发布

阅读量526

点赞数 2

分类专栏：新世界杂货铺文章标签： http go 后端

本文链接：https://blog.csdn.net/u014440645/article/details/109275460

版权

本文深入分析Go中HTTP2.0请求的标头压缩流程，重点探讨HPACK的静态表、动态表以及索引列表。通过实例解析编码和解码过程，展示如何利用静态和动态表减少数据传输，实现高效的HTTP2.0通信。

摘要由CSDN通过智能技术生成

来自公众号：新世界杂货铺

文章目录

阅读建议

这是HTTP2.0系列的最后一篇，笔者推荐阅读顺序如下:

回顾

在前篇(*http2ClientConn).roundTrip方法中提到了写入请求header，而在写入请求header之前需要先编码（源码见https://github.com/golang/go/blob/master/src/net/http/h2_bundle.go#L7947）。

在中篇(*http2ClientConn).readLoop方法中提到了ReadFrame()方法，该方法会读取数据帧，如果是http2FrameHeaders数据帧，会调用(*http2Framer).readMetaFrame对读取到的数据帧解码（源码见https://github.com/golang/go/blob/master/src/net/http/h2_bundle.go#L2725）。

因为标头压缩具有较高的独立性，所以笔者基于上面提到的编/解码部分的源码自己实现了一个可以独立运行的小例子。本篇将基于自己实现的例子进行标头压缩分析（完整例子见https://github.com/Isites/go-coder/blob/master/http2/hpack-example/main.go）。

开门见山

HTTP2使用 HPACK 压缩格式压缩请求和响应标头元数据，这种格式采用下面两种技术压缩：

通过静态哈夫曼代码对传输的标头字段进行编码，从而减小数据传输的大小。
单个连接中，client和server共同维护一个相同的标头字段索引列表（笔者称为HPACK索引列表），此列表在之后的传输中用作编解码的参考。

本篇不对哈夫曼编码做过多的阐述，主要对双端共同维护的索引列表进行分析。

HPACK 压缩上下文包含一个静态表和一个动态表：静态表在规范中定义，并提供了一个包含所有连接都可能使用的常用 HTTP 标头字段的列表；动态表最初为空，将根据在特定连接内交换的值进行更新。

HPACK索引列表

认识静/动态表需要先认识headerFieldTable结构体，动态表和静态表都是基于它实现的。

type headerFieldTable struct {
   
	// As in hpack, unique ids  are 1-based. The unique id for ents[k] is k + evictCount + 1.
	ents       []HeaderField
	evictCount uint64

	// byName maps a HeaderField name to the unique id of the newest entry with the same name.
	byName map[string]uint64

	// byNameValue maps a HeaderField name/value pair to the unique id of the newest
	byNameValue map[pairNameValue]uint64
}

下面将对上述的字段分别进行描述：

ents：entries的缩写，代表着当前已经索引的Header数据。在headerFieldTable中，每一个Header都有一个唯一的Id，以ents[k]为例，该唯一id的计算方式是k + evictCount + 1。

evictCount：已经从ents中删除的条目数。

byName：存储具有相同Name的Header的唯一Id，最新Header的Name会覆盖老的唯一Id。

byNameValue：以Header的Name和Value为key存储对应的唯一Id。

对字段的含义有所了解后，接下来对headerFieldTable几个比较重要的行为进行描述。

(*headerFieldTable).addEntry：添加Header实体到表中

func (t *headerFieldTable) addEntry(f HeaderField) {
   
	id := uint64(t.len()) + t.evictCount + 1
	t.byName[f.Name] = id
	t.byNameValue[pairNameValue{
   f.Name, f.Value}] = id
	t.ents = append(t.ents, f)
}

首先，计算出Header在headerFieldTable中的唯一Id，并将其分别存入byName和byNameValue中。最后，将Header存入ents。

因为使用了append函数，这意味着ents[0]存储的是存活最久的Header。

(*headerFieldTable).evictOldest：从表中删除指定个数的Header实体

func (t *headerFieldTable) evictOldest(n int) {
   
	if n > t.len() {
   
		panic(fmt.Sprintf("evictOldest(%v) on table with %v entries", n, t.len()))
	}
	for k := 0; k < n; k++ {
   
		f := t.ents[k]
		id := t.evictCount + uint64(k) + 1
		if t.byName[f.Name] == id {
   
			delete(t.byName, f.Name)
		}
		if p := (pairNameValue{
   f.Name, f.Value}); t.byNameValue[p] == id {
   
			delete(t.byNameValue, p)
		}
	}
	copy(t.ents, t.ents[n:])
	for k := t.len() - n; k < t.len(); k++ {
   
		t.ents[k] = HeaderField{
   } // so strings can be garbage collected
	}
	t.ents = t.ents[:t.len()-n]
	if t.evictCount+uint64(n) < t.evictCount {
   
		panic("evictCount overflow")
	}
	t.evictCount += uint64(n)
}

第一个for循环的下标是从0开始的，也就是说删除Header时遵循先进先出的原则。删除Header的步骤如下：

删除byName和byNameValue的映射。
将第n位及其之后的Header前移。
将倒数的n个Header置空，以方便垃圾回收。
改变ents的长度。
增加evictCount的数量。

(*headerFieldTable).search：从当前表中搜索指定Header并返回在当前表中的Index（此处的Index和切片中的下标含义是不一样的）

func (t *headerFieldTable) search(f HeaderField) (i uint64, nameValueMatch bool) {
   
	if !f.Sensitive {
   
		if id := t.byNameValue[pairNameValue{
   f.Name, f.Value}]; id != 0 {
   
			return t.idToIndex(id), true
		}
	}
	if id := t.byName[f.Name]; id != 0 {
   
		return t.idToIndex(id), false
	}
	return 0, false
}

如果Header的Name和Value均匹配，则返回当前表中的Index且nameValueMatch为true。

如果仅有Header的Name匹配，则返回当前表中的Index且nameValueMatch为false。

如果Header的Name和Value均不匹配，则返回0且nameValueMatch为false。

(*headerFieldTable).idToIndex：通过当前表中的唯一Id计算出当前表对应的Index

func (t *headerFieldTable) idToIndex(id uint64) uint64 {
   
	if id <= t.evictCount {
   
		panic(fmt.Sprintf("id (%v) <= evictCount (%v)", id, t.evictCount))
	}
	k := id - t.evictCount - 1 // convert id to an index t.ents[k]
	if t != staticTable {
   
		return uint64(t.len()) - k // dynamic table
	}
	return k + 1
}

静态表：Index从1开始，且Index为1时对应的元素为t.ents[0]。

动态表: Index也从1开始，但是Index为1时对应的元素为t.ents[t.len()-1]。

静态表

静态表中包含了一些每个连接都可能使用到的Header。其实现如下：

var staticTable = newStaticTable()
func newStaticTable() *headerFieldTable {
   
	t := &headerFieldTable

最低0.47元/天解锁文章

Gopher指北

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录