如何使用 Wireshark 分析 TCP 吞吐瓶颈
Debug 网络质量的时候,我们一般会关注两个因素:延迟和吞吐量(带宽)。延迟比较好验证,Ping 一下或者 mtr 一下就能看出来。正巧,我在3A平台购买了云服务器,可以测试一个 debug 吞吐量的办法。
看重吞吐量的场景一般是所谓的长肥管道。 比如下载大文件。吞吐量没有达到网络的上限,主要可能受 3 个方面的影响:
- 发送端出现了瓶颈
- 接收端出现了瓶颈
- 中间的网络层出现了瓶颈
发送端出现瓶颈一般的情况是 buffer 不够大,因为发送的过程是,应用调用 syscall,将要发送的数据放到 buffer 里面,然后由系统负责发送出去。如果 buffer 满了,那么应用会阻塞住(如果使用 block 的 API 的话),直到 buffer 可用了再继续 write,生产者和消费者模式。
发送端出现瓶颈一般都比较好排查,甚至通过应用的日志看何时阻塞住了即可。大部分情况都是第 2,3 种情况,比较难以排查。这种情况发生在,发送端的应用已经将内容写入到了系统的 buffer 中,但是系统并没有很快的发送出去。
TCP 为了优化传输效率(注意这里的传输效率,并不是单纯某一个 TCP 连接的传输效率,而是整体网络的效率),会:
- 保护接收端,发送的数据不会超过接收端的 bu