原理
音频的原理
把模拟信号转变成 数字信号,前者是连续的,后者离散的
。因此有DAC和ADC。
需要关注的三个指标,这三个指标决定音频的质量
-
比特率:表示经过编码(压缩)后的
音频数据每秒钟
需要用多少个比特来表示,单位常为kbps。这个数字越大音频质量越好,但是数据文件就越大。
-
响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。这个就是
振幅
。计算方式20lg(amp1/基准振幅),基准振幅就是在声音最大的时候采用的振幅。 -
采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指
每秒钟采集多少个样本
。采样率越高其质量越好,一般在底层是48k采样率,宽带电话是16k,窄带是8k。
Nyquist采样定律:采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。
这句话的意思大概就是, 比如采样率是16Khz, 那么频率只能达到8kHz;如果是48kHz的采样率,那么频率可以达到24kHz.
开源软件 audacity
的插件就是ny结尾的,里面用lisp语言写的,用于计算一些rms、THD等
- 编码方式
主流的有2中,PCM和DPCM,
- 脉冲编码调制 (Pulse Code Modulation)是一种对
模拟信号数字化的取样技术
,将模拟语音信号变换为数字信号的编码方式,把时间上连续的信号变成时间上离散的信号
。把连续的编码成离散的,这里有损失,但是人耳听不出来。 - 差分脉冲编码调制(Differential Pulse code modulation,DPCM),是一种对模拟信号的编码模式,与PCM不同每个抽样值不是独立的编码,而是先根据前一个抽样值计算出一个预测值,再取当前抽样值和预测值之差作编码用.此差值称为预测误差.抽样值和预测值非常接近(因为相关性强),预测误差的可能取值范围比抽样值变化范围小.所以可用少几位编码比特来对预测误差编码,从而降低其比特率.这是利用减小冗余度的办法,降低了编码比特率。这个数据是网上找的,总的一句话就是
与相等的PCM比较,这种编码只需要25%的比特数
,比特率小,文件就小。
视频编码
- 视频通过其中
每一帧的图像
表达信息;视频包含的音频可提供大量信息;视频通过图像的运动、场景的变换提供信息; - 视频信号有2种
-
RGB颜色空间
-
YUV颜色空间 (Y=明亮度, UV=就是色度,包含了色调和饱和度)
没有UV信息一样可以显示完整的图像
,只不过是黑白的,这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。并且,YUV不像RGB那样要求三个独立的视频信号同时传输,所以用YUV方式传送占用极少的频宽
。
因此 YUV编码更常用。
RGB和YUV之间可以转换。
视频编码的最主要目的是数据压缩
,在传输过程中花费太多的带宽。
数据有冗余的,所以可以压缩