流媒体:音视频同步

一、背景

音频和视频都是单独以一条流的形式存在,互不干扰。那么在播放时根据视频的帧率(Frame Rate)和音频的采样率(Sample Rate)通过简单的计算得到其在某一Frame(Sample)的播放时间分别播放,理论上应该是同步的。但是由于机器运行速度,解码效率等等因素影响,很有可能出现音频和视频不同步,例如出现视频中人在说话,却只能看到人物嘴动却没有声音,非常影响用户观看体验。

二、同步方案

目前主要有三种方式实现同步:
(1)将视频和音频同步外部的时钟上,选择一个外部时钟为基准,视频和音频的播放速度都以该时钟为标准。
(2)将音频同步到视频上,就是以视频的播放速度为基准来同步音频。
(3)将视频同步到音频上,就是以音频的播放速度为基准来同步视频。

三、方案选择

比较主流的是第三种,将视频同步到音频上。至于为什么不使用前两种,因为一般来说,人对于声音的敏感度更高,如果频繁地去调整音频会产生杂音让人感觉到刺耳不舒服,而人对图像的敏感度就低很多了,所以一般都会采用第三种方式。
处理步骤:
(1)音频帧正常顺序播放,音频播放时间作为基准时钟
(2)视频帧在解码后,根据基准时钟来调整当前处理:
♦️ 视频帧PTS >基准时钟:根据时间差异计算视频帧显示延时
♦️ 视频帧PTS< 基准时钟< 下一GOP点:丢弃当前帧,直接依次解码后续帧
♦️ 视频帧PTS<下一GOP点<基准时钟:直接调整到下一GOP开始,依次解码

3.1 复习DTS、PTS和时间基

PTS:Presentation Time Stamp,显示渲染用的时间戳,告诉我们什么时候需要显示
DTS:Decode Time Stamp,视频解码时的时间戳,告诉我们什么时候需要解码
在音频中PTS和DTS一般相同。但是在视频中,由于B帧的存在,PTS和DTS可能会不同

  • 帧顺序:
    实际帧顺序:I B B P
    存放帧顺序:I P B B
    解码时间戳DTS:1 4 2 3
    展示时间戳PTS:1 2 3 4

参考

音视频同步分析-基于ffplay - 知乎
FFmpeg音视频同步_CindyWangry的博客-CSDN博客_ffmpeg音画同步
音视频同步原理 - 知乎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值