音频
采样频率:一秒钟采样的样本数,常用的采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等
若采样率为44100,一帧的样本数为1024
一帧的时间为:1024 * 1000ms / 44100 = 23.219954ms
一秒钟的帧数:fps = 44100 / 1024 = 43.06640625帧
AAC:常用一帧包含采样数1024
MP3:常用一帧包含采样数1152
位深度:也叫采样位深,声卡采集并处理声音的解析度,单位 bit,常用的16bit,专业声卡则更大32bit、64bit
假设音频采样率 = 8000,采样通道 = 2,位深度 = 8,采样间隔 = 20ms
首先我们计算一秒钟总的数据量,采样间隔采用20ms的话,说明每秒钟需采集50次(1s=1000ms),那么总的数据量计算为
一秒钟总的数据量 = 8000 * 2 * 8 / 8 = 16000(Byte) ---这里除以8是因为 1Byte = 8bit
所以每帧音频数据大小 = 8000 * 2 * 8 / 8 =320(Byte)
每个通道样本数 = 320 / 2 = 160(Byte)
时间戳:pts = inc++ * (一帧的样本数 * 1000 / 采样频率) 其中inc初始值为0,每次打完时间戳inc加1
视频:
视频帧率,25帧每秒,则按毫秒计,1000 / 25 = 40ms
时间戳:pts = inc++ *(1000 / fps) 其中inc初始值为0,每次打完时间戳inc加1