php 降低采样率,采样率,位深,码率,无损音乐,写给小白的科普 (申精)

本帖最后由 tymyf 于 2020-2-5 14:18 编辑

非常有意义的帖子,补充一些内容:

CD一般来说是Compact Disc Digital Audio的简称,翻译成中文大概是紧凑型数字音频盘的意思。最初由飞利浦和索尼在上个世纪80年代初以红书(Red Book)的形式联合发布,在1987年被标准化组织IEC接纳为正式标准,编号为IEC 60908。这个标准最近一次修订是在1999年。飞利浦和索尼出版了一系列以颜色命名的标准,全部都是关于Compact Disc的,红书(Red Book)就是其中描述数字音频CD的一本。

IEC 60908整个标准还是挺繁杂的,我们只关注其中的编码部分。简单来说,存放于CD中的音频编码标准就是声音通道数为2、采样精度16位、编码格式为线性PCM、采样率固定是44.1KHz。

在红书(Red Book)发布之前的1970年代,还存在着一种录音设备叫做PCM适配器。故名思义,它把模拟的音频信号转换成数字的PCM编码,并提供录制到视频存储设备上的接口。为什么音频和视频搅和在一起?因为当时已有的音频存储设备带宽不够大,不足以提供16位的PCM数字音频的存取带宽,这个带宽大概在1M~1.5M bit/s,这在当时是一个相当“高”的带宽,只有视频存储设备才有如此高的存取能力。PCM适配器把音频数据按特定的视频格式打包,从而可以借助于已有的“高带宽”视频存储设备实现音频数据的存取。

当时大量存在的视频存储设备主要支持两种视频制式,一种是25帧制式(称为CCIR 625/50,也叫PAL),一种是30帧制式(称为EIAN 525/60,也叫NTSC)。当时世界上有电视普及的国家按这两种制式分为两个阵营。

首先看25帧(即50场)的PAL制式中,这种制式的一帧中,可利用来录制音频的视频行最多能有588行,分到每一场(Field)有294行。

30帧(即60场)的NTSC制式,这种制式的一帧中,可利用来录制音频的视频行最多能有490行,分到每一场就有245行。

PAL :294行

NTSC:245行

如果每行放2个数据:

PAL: 294行x50场x2=29.4khz

NTSC:245行x59.94场x2=29.351khz

放3个:

PAL: 294行x50场x3=44.1khz

NTSC: 245行x59.94场x3=44.05hkz

可以看出来如果每行放两个数据每秒视频携带的数据量是29khz 左右,这个数据量就是音频的采样率,这个采样率只能还原fs/2的音频信号,也就只能还原到15khz ,无法达到20khz的音频信号,所以每行需要放3个数据,这样数据量也就是44.1khz,这样音频采样率也就定在了44.1khz,这样的音频采样率可以保证对两种视频制式的最大限度兼容,并且一直沿用至今。

为什么数据量不继续扩大呢?也就是每行放4个数据,这样频率就能到58.5khz。因为音频视频的所有频率都是一个时钟源分频出来的,这个时钟源就是所有频率的公倍数,这样就要求每个频率尽量做到最小,可以使设备稳定同时功耗最低。

44.1kHz这个数字,给后人留下了很多麻烦。首先它不是整数,在SRC(采样频率变换)的时候,它不能简单地分频和倍频,这就给早期电脑的AC97音频规格,带来了SRC转换质素的问题。(这个有点像电影制式和PAL制式,每秒只差1帧,所以以前一般来说就直接一帧对一帧进行制作,这样PAL每秒会比电影多放一帧,也就是速度提高了1/24,而且声音的音调会升高。这就是当时一些DVD爱好者不喜欢PAL制DVD的原因之一。)而当时的电脑声卡都要遵循AC97规格,只支持48kHz输出,用电脑播放CD或者CD抓轨的音频文件,都要加以转换,转换的过程会有损失,曾经某些声卡就饱受诟病。至于DAT,没有这个问题,因为它的44.1和48kHz采样频率,都是原生的,不是转换出来的,不转换就不会劣化。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值