基本概念
- 过采样:超过音频本身实际带宽的采样率,如音频带宽12kHz,用96kHz采样属于过采样,用24kHz采样则较为合理。上采样,也属于过采样。常见采样率:
16/32/48/44.1/48/88.2/96kHz
。 - 上采样:从较低采样率上升至高采样率,如
16kHz
采样提高至48kHz
采样,本质采用的是插值方法。 - 下采样:从较高采样率下降至低采样率,如
48kHz
采样下降至16kHz
采样,本质采用的是抽样方法。 - 上混:多个单声道混成多声道,类似于声轨处理。
- 下混:多声道合成少声道,类似于采样值的混叠相加。
上混和下混的区别
- 上:少个声道,拆分混音成多个声道,如单声道到立体声
- 下:多个声道,合并混音成少声道,如立体声到单声道
- 类比上采样、下采样
语音增强
语音与音频的区别是?
- 人说话声为语音,大自然或者乐器声为音频,有规律的乐器声或人歌唱声或两者结合为音乐。
- 人的发音器官发出的声音称为语音,主要集中在频段 300Hz到3400Hz之间。
- 大自然和乐器产生的声音称为音频,人耳可以听到的频率在20Hz 到20KHz 之间。
语音中有效带宽的分类是?
- 窄带, NB,4k, Narrow Band
- 宽带,WB,8k
- 半超宽带,SSWB,12k,Semi Super Wide Band
- 超宽带,SWB,16k
- 全带,FB,20k
- 主要依据来自人耳听觉范围:20Hz-20kHz
何为音高?
- 基频的频率F0较大(大于500Hz)且背景的频谱能量比较低时,则认为是高音高。简单说就是基频频率大。低音高就是基频频率小。
语音增强的回声消除中远端和近端是什么概念?
- 远端:对方,对方发声传递到近端
- 近端:我方,我方采集声音反馈回远端