最近在研究音视频技术,对其中的码率计算做了点研究,记录一下
音频录制时,对于产品经理来说,他们最关注的应该就是码率。因为码率意味着流量,流量意味着钱。
而对于程序员来说,能够设置的无非就只有通道数,采样率,和深度。
这就会产生产品经理与开发的术语不一致的矛盾,会出现交流问题。
那么这两者之间的关系是如何呢?
通道数
通道数是指你的喇叭能够出几路声音。对于人耳来说,因为左右耳的距离不同,听到的声音波形会存在些许差异。对于单声道来说,你能感受到的音质同真实声音相比就会感觉不真实。一般来说,采用2通道可以应付大多数场景。
采样率
采样率即声音采样的频率,即每秒记录多少个音量点。对于人耳来说,声音的范围是20-20khz,而人的说话声音范围是300-3400hz。奈奎斯特定律指出要重建信号,必须要求采样率是原信号最高频率的2倍以上。即我们期望将一段音频信号进行录制后还原,录制时的采样频率必须达到原音频信号最高频率的2倍以上,才能保证高频信号的完整。
那么对于音频文件来说,一般的44.1khz采样率就可以满足了,再高人也听不到。而对于通话场景,11.025khz即可。这也是为什么语音通话不那么耗费流量的原因。
采样深度
采样深度一般有8,16,32等,即使用几个位来表示音量的大小。可以类比下图片,颜色深度越大,能够表现的色彩就会越丰富。
码率
好了终于到了码率了,先给一个公式码率=通道数*采样率*采样深度。
以44