这里主要说明一下DSP中的几个重要参数的意义,基本过程不做解释。
模拟analogue:连续信号
数字digital:离散信号
ADC——DSP——DAC
ADC:Analogue to Digital Convertor:注意:量子化Quantisation:将每处样本信号的数值在允许的动态范围内数字化(根据bit数)(样本选取数根据采样率定)
DSP:Digital Signal Processing
DAC:同ADC
Sample rate采样率:每秒从(模拟)信号中采集的样本个数(组成数字信号的个数)常为44.1KHz。原因是最早的数字录音由一台录像机加上一部PCM编码器制作的,由于当时使用的是PAL录像制式(帕制,与之对应的有NTSC),场频50Hz,可用扫描线数294条,一条视频扫描线的磁迹中记录3个音频数据块,把他们相乘,就得到了44100。
香农-奈奎斯特采样定理(采样定律):单个样本信号的频率不能超过采样率的一半。对于44.1KHz来说,就是22.05KHz。原因我认为是:我们都知道任何一个信号都可以通过傅里叶展开变成若干个正弦信号,而要想准确的描绘一个正弦信号,我们只需要知道它的一个周期即可,而如何确定正弦信号的一个周期呢?
正弦的函数表达式如下,其中A是振幅, omiga是角频率, fai是初相,也就是有三个常量就能唯一确定一个正弦信号: 一个函数三个未知数,所以需要代入三个不同的点解出三个未知数,得到唯一的表达式,所以一个周期需要取三个以上的点才能完美采样。从图像上也能看出:在等时间间隔的情况下,如果采样间隔恰好是正弦信号周期的一半,也就是一个信号周期内能采集到两个点,如果恰好采样到的两个点幅值都是0,那就恰好无法计算出正弦信号的表达式。
如果采样间隔比信号周期的一半还要小,那么一个信号周期内至少能采集到三个点,一定能够计算出正弦信号的表达式。
所以我们可以这么说:如果采样的时间间隔小于被采样正弦信号周期的一半,我们一定能无失真的恢复出被采样信号。
并且工程上大多数信号都能展开成若干正弦信号叠加,如果我的采样间隔能够完美采样周期最短的那个正弦信号,那当然能完美采样这个由若干正弦叠加出来的信号。
采样间隔的倒数是采样率,信号周期的倒数是信号频率,当采样率大于被采样信号中频率最高信号频率的2倍时,采样后的信号能完美保留被采样信号的所有信息。
出处:https://www.zhihu.com/question/431920644/answer/1597049082
Word size(字节大小):一般为16bit。意思是每个样本的可取值有2^16
个可选值。转换为动态范围即是20(log(2^16))=96dB。
动态范围(dB):dB本身是个无量纲,代表的是一种比值。只不过由于2^16太大,难以很好的看出其中变化,所以我们把它变成对数形式易于观察。
在声音(滤波器)里,dB是根据所测声压大小和人的听阈(20μPa)的对数比得出的。
(滤波器中曲线都是由-xxxdB到0dB,指的是由削减量最大分贝(最小分贝)到削减量最小分贝(最大分贝))H(w) = |V0/Vin|(模)= 1/1+(wRC)^2(低通滤波器),这样就把电转换为音频信号了。
bit rate比特率:表示每秒的音频需要都是bit(字节)来表示。以16bit为例,即2* 16* 44100 = 1.4Mbps =1400000bits/s(每秒1.4M)
Communication:Information Coding for Transmission
Speech Processing:Speech Analysis, Recognition, Synthesis
and
Compression (e.g. mp3 files)
Image Processing
Character Recognition, Image Recognition,
and
Compression (e.g. mp4 files)
Biomedical Processing
Analysis of physiological signals