音视频网络通信中的延时优化_网络研讨会的音视频延时标准-CSDN博客

本文链接：https://blog.csdn.net/m0_60259116/article/details/124477048

前言

在处理影视频网络通信的过程中，我们经常会遇到如下几个问题，今天就围绕如下几个问题讲讲我个人的优化心得.

为什么 TCP 传输的延时比 UDP 大？
直播的延时往往在 1s 以上，根本原因在哪里？
RTC 实时通信的延时要求在 400ms 以内，是怎么做到的？

举个栗子
我们就以网上购物，一份快递从发货到送达这一过程的耗时优化为例子：

在快递站入库和逗留的时间太长？—— 比如，每个快递件入库半天堆积 1 天再才转派发，看看，有哪些可能的因素会影响快递从商家 A 传递到消费者 B 的手中的时间？如上图所示：

快递数量不均匀，有时候特别多（堆积如山），有时候特别少（零零散散），各节点的资源利用率未能充分发挥出来
中途发生快递丢失了，需要重新补发一份（整体时间基本上要翻倍）
运输的路线太堵，导致在路上耗费太多时间
有什么思路，一一解决上述的延时因素，以提高快递的送达速度呢？

提高每个快递站的吞吐量，减少每个中转站的缓存，加速快递的流转？

快件的揽件、传输与派送，从 “天” 的粒度拆分到更细的粒度，比如小时粒度，以追求资源的调度更动态和平滑一点？
每个快件同时发 2 份？丢了一个还可以派送另一个？—— 当然，负面影响是带来运力资源的增加
动态选择合适的中转运输路线，哪里不堵走哪里？—— 运输路线动态规划避开拥堵，这是一门艺术。

从上面的探索可以看出，优化延时，我们关注的点主要是：减少中间环节的缓存，最大化提高资源的利用率，通过冗余对抗丢失，动态地规划传输路径。如果你能理解这几个抽象的点，那么恭喜，下面你就不难理解如何降低音视频的网络传输延时了。

分析原因
为什么 TCP 传输的延时比 UDP 大？
因为 TCP 保证了 “可靠传输”，当数据发生丢失后，一定会进行重传，重传带来延时（类似快递丢失补发），并且非常影响后续数据的持续及时发送：

因为 TCP 有个 “缓存队列”（类似于快递站），它不会来一个数据就立马发送出去，而是先缓存起来，通过一个 “滑动窗口” 来控制发送频率（类似快递站的派送人力），在上一波数据发送完毕得到 ACK 确认后，再发送下一波数据（类似一箱快递的派送结束后再投入下一箱）；而 UDP 则没有该机制，闭着眼睛发（需要抢占整个地区更多的快递员）
因为 TCP 是一个 “君子”，一旦发现有丢数据或者网络不好，则主动去 “退让”，减少自己的 “滑动窗口” 大小（让出快递人力给地区其他公司），导致自己的数据发得更慢了
直播的延时往往在 1s 以上，根本原因在哪里？
直播底层的传输协议（RTMP）默认使用了 TCP ，引入了 TCP 上述延时大的特性
由于 TCP 不丢数据的特性，会导致播放端一旦因为网络原因卡住多少秒，在播放器不追帧的情况下，后续恢复播放后就有多少秒的延时（因为这些因为网络卡住没有及时发送过来的数据不会凭空消失）
为了实现播放秒开，通常直播的流媒体服务器，会缓存最近的 GOP，在播放器不追帧的情况下，会带来一个固定的延时（取决于推流端配置的 GOP 大小）