大模型之二十九-语音识别Whisper推理加速

在上一篇博客《大模型之二十八-语音识别Whisper进阶》中我们留了一个尾巴,就是在流式场景以及如何提升推理速度。

流式场景

流式场景分两种,一种是伪流式一种是真流式,伪流式就是bilibili或者YouTub,终端用户在观看视频的时候,是从服务器或者CDN节点下载视频,其会缓存一些数据,对于真流式场景就是抖音直播这些场景,但是双向视频通讯的会议场景对延迟要求更为苛刻。
在视频会议场景,所有传输都没法类似制作好的视频事先缓存,因网络拥塞、数据传输路径的长度、服务器处理时间会导致通讯延迟,延迟是指数据从视频会议的一端源头传到另一端所需的时间,通常以毫秒(ms)为单位。在实时通信中,尤其是在视频会议中,较低的延迟是保证流畅通信的重要因素。
延迟对通话体验的影响:

延迟 影响
低于 150 ms 良好的,用户通常不会感觉到明显的延迟,类似面对面的交流。
150 ms 到 400 ms 大多数情况仍可接受,在快速互动的对话
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shichaog

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值