看来逢年过节,烧香上供,除了图灵祖师爷还要加上这两位了。
闲聊
我们知道声音是一种纵波,而不管是男低音或者女高音,发出的频率范围在85~1.1K Hz之间,而人耳能听到的声音的频率范围在20~20K Hz之间。所以在日常生活中我们听到彼此交谈妥妥的。
但是发明计算机之后,在数字世界里怎么存储声音呢?从第一章就走过来的我们当然不陌生,当然是采样、量化后存储数字信号,听的时候再还原回模拟信号。
好了,这里面的第一个问题就是,采样率该怎么设定?设定大了浪费存储空间,设定小了会有什么问题?
百度百科说:
在数字音频领域,常用的采样率有:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz-AM调幅广播所用采样率
22,050 Hz和24,000 Hz- FM调频广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频 CD, 也常用于 MPGE-1 音频(VCD, SVCD, MP3)所用采样率
47,250 Hz - 商用 PCM录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 商用数字录音机所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。
对比一下本地的音频文件:
采样定律
要了解什么样的采样频率合适,我们可以翻出来上一节的一张图,直观感受一下;
对于临界采样和过采样,我们都可以用一个以原点为中心,带宽为
那么这个问题就转换为求解临界采样的时候,连续脉冲函数的频率的问题了。
一、带限函数
先上定义,对于以原点为中心的有限带宽
好抽象,上图:
这么想,人发声只能在85~1.1K Hz之间,那么人发声也是一个带限函数。
二、对带限函数进行采样
我们用周期为
有图可知,要想从
这个公式就是奎更斯特(香农)采样定理:
如果以超过函数最高频率的两倍的取样率来获取样本,连续的带限函数可以完全地从它的样本集来恢复。
物理意义就是:
如果要把一个信号还原回来,就要以这个信号最高频率的2倍以上进行采样。
三、如何恢复
只关心如何采样,而不告诉我们如何恢复显然不是雷神的风格。看下图;
该图显示了一个过采样后的
其中:
低通滤波器:
将采样后的傅里叶
一旦拿到
完美!