音频质量评估-1

原理

音频的原理

把模拟信号转变成 数字信号,前者是连续的,后者离散的。因此有DAC和ADC。
需要关注的三个指标,这三个指标决定音频的质量

  1. 比特率:表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,单位常为kbps。 这个数字越大音频质量越好,但是数据文件就越大。

  2. 响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。这个就是振幅。计算方式20lg(amp1/基准振幅),基准振幅就是在声音最大的时候采用的振幅。

  3. 采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采集多少个样本。采样率越高其质量越好,一般在底层是48k采样率,宽带电话是16k,窄带是8k。

Nyquist采样定律:采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。

这句话的意思大概就是, 比如采样率是16Khz, 那么频率只能达到8kHz;如果是48kHz的采样率,那么频率可以达到24kHz.

开源软件 audacity 的插件就是ny结尾的,里面用lisp语言写的,用于计算一些rms、THD等

  • 编码方式
    主流的有2中,PCM和DPCM,
  1. 脉冲编码调制 (Pulse Code Modulation)是一种对模拟信号数字化的取样技术,将模拟语音信号变换为数字信号的编码方式,把时间上连续的信号变成时间上离散的信号。把连续的编码成离散的,这里有损失,但是人耳听不出来。
  2. 差分脉冲编码调制(Differential Pulse code modulation,DPCM),是一种对模拟信号的编码模式,与PCM不同每个抽样值不是独立的编码,而是先根据前一个抽样值计算出一个预测值,再取当前抽样值和预测值之差作编码用.此差值称为预测误差.抽样值和预测值非常接近(因为相关性强),预测误差的可能取值范围比抽样值变化范围小.所以可用少几位编码比特来对预测误差编码,从而降低其比特率.这是利用减小冗余度的办法,降低了编码比特率。这个数据是网上找的,总的一句话就是与相等的PCM比较,这种编码只需要25%的比特数,比特率小,文件就小。

视频编码

  1. 视频通过其中每一帧的图像表达信息;视频包含的音频可提供大量信息;视频通过图像的运动、场景的变换提供信息;
  2. 视频信号有2种
  • RGB颜色空间

  • YUV颜色空间 (Y=明亮度, UV=就是色度,包含了色调和饱和度)没有UV信息一样可以显示完整的图像,只不过是黑白的,这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。并且,YUV不像RGB那样要求三个独立的视频信号同时传输,所以用YUV方式传送占用极少的频宽

因此 YUV编码更常用。

RGB和YUV之间可以转换。

视频编码的最主要目的是数据压缩,在传输过程中花费太多的带宽。
数据有冗余的,所以可以压缩

  • 4
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值