DTS和PTS的解释

DTS和PTS的解释 
FFmpeg里有两种时间戳:DTS(Decoding Time Stamp)和PTS(Presentation Time Stamp)。顾名思义,前者是解码的时间,后者是显示的时间。要仔细理解这两个概念,需要先了解FFmpeg中的packet和frame的概念。 
FFmpeg中用AVPacket结构体来描述解码前或编码后的压缩包,用AVFrame结构体来描述解码后或编码前的信号帧。对于视频来说,AVFrame就是视频的一帧图像。这帧图像什么时候显示给用户,就取决于它的PTS。DTS是AVPacket里的一个成员,表示这个压缩包应该什么时候被解码。如果视频里各帧的编码是按输入顺序(也就是显示顺序)依次进行的,那么解码和显示时间应该是一致的。可事实上,在大多数编解码标准(如H.264或HEVC,当出现B帧的时候)中,编码顺序和输入顺序并不一致。于是才会需要PTS和DTS这两种不同的时间戳。  
视频帧根据帧率,在同一时间基上累加, 
例如,25帧每秒,则按毫秒计,1000/25=40ms,在首帧pts上进行累加 音频根据采样率及样本个数,在同一时间基上累加, 例如,1024
个样本,44100
采样率,毫秒计,
1000*1024/44100=23.21995464852607709750566893424 ms 
基本理论是这样,但实际的同步远没有这么简单,掉线,断网,弱网,丢帧,跳帧,等一系列均对你的同步进行阻挠,需要根据具体情况做同步,坐等高手给出较为鲁棒的同步措施。  
一固定帧率 1. 视频时间戳 
     pts = inc++ *(1000/fps);  其中inc是一个静态的,初始值为0,每次打完时间戳inc加1. 
    在ffmpeg,中的代码为 
    pkt.pts= m_nVideoTimeStamp++ * (m_VCtx->time_base.num * 1000 / m_VCtx->time_base.den);   




2. 音频时间戳 
    pts = inc++ * (frame_size * 1000 / sample_rate)    在ffmpeg中的代码为    pkt.pts= 
m_nAudioTimeStamp++ 

(m_ACtx->frame_size 

1000 

m_ACtx->sample_rate); 
采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本的次数。 。正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等,如果采用更高的采样频率,还可以达到DVD的音质 
对采样率为44.1kHz的AAC音频进行解码时,一帧的解码时间须控制在23.22毫秒内。 背景知识: 
(一个AAC原始帧包含一段时间内1024个采样及相关数据) 分析: 1 AAC 
音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样频率(单位为s) 一帧 1024个 sample。采样率Samplerate 44100KHz,每秒44100个sample, 所以根据公式   音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样频率 当前AAC一帧的播放时间是= 1024*1000000/44100= 22.32ms(单位为ms) 2 MP3   
mp3 每帧均为1152个字节,则: 
frame_duration = 1152 * 1000000 / sample_rate 
例如:sample_rate = 44100HZ时,计算出的时长为26.122ms,这就是经常听到的mp3每帧播放时间固定为26ms的由来。  
二可变帧率 
有很多的采集卡,摄像头,在做采集的时候,明明设置的25FPS,但实际采

集数据回调过来,发现并不是40毫秒的间隔,而是50,60,甚至100不等的时间间隔。  这就给编码后打时间戳带来很大的困难。 
 
在libav里,我们的默认编码参数都是: 
ptAvEncoder->ptAvStreamVideo->codec->time_base.den = s32Fps; ptAvEncoder->ptAvStreamVideo->codec->time_base.num = 1; 这样在编码后的时间戳以1递增,只适合于固定帧率。  
我们来改一下: 
ptAvEncoder->ptAvStreamVideo->codec->time_base.den = s32Fps * 1000; ptAvEncoder->ptAvStreamVideo->codec->time_base.num = 1* 1000; 
这样就把时间戳的scale变成了毫秒,就可以以毫秒为单位进行计算了,如下: tAvPacket.pts = ((s64)u32TimeStamp * (s64)s32Fps); 
u32TimeStamp是从开始记录的时间差值,以毫秒为单位;s32Fps是帧率。  
对于音频,mp4文件默认是采样率为tick的,时间戳计算为: 
tAvPacket.pts = (AvEncoderAudioInSizeGet(hHandle) * ( (s64)(u32TimeStamp)) / (AvEncoderAudioInSizeGet(hHandle) * 1000 / ptAvEncoder->ptAvStreamAudio->codec->sample_rate); 
AvEncoderAudioInSizeGet(hHandle) 每次编码器需要的PCM数据长度。 u32TimeStamp是从开始记录的时间差值,以毫秒为单位。 
 ptAvEncoder->ptAvStreamAudio->codec->sample_rate PCM采样率,代表一秒的数据量。 
因为乘以了1000,所以也化成了毫秒单位。 
对于mp4,视频直接用绝对时间,音频用数据量,对rtmp,视频是毫秒计算,音频也换算成毫秒计算
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值