欢迎来我的知乎专栏进一步探讨交流。
https://www.zhihu.com/column/c_1287066237843951616
学习过程中,碰到了很多声学前端信号处理名词的专用简写,特此记录下,欢迎各位知友批评与指点。
每个概念深究的话,均是可以单独成章的,后续有时间的话再进行细化。
会不断更新与完善。。
缩写 | 全称 | 中文释义 | 应用场景 |
ABF | Adaptive Beamformer | 自适应波束形成器 | 波束形成方法。 |
AGC | Automatic Gain Control | 自动增益控制 | 为了使输出的语音信号增益尽量保持稳定,避免忽大忽小,需要进行自动增益控制。 |
AR | Autoregressive model | 自回归模型 | 基础的时间序列模型 |
ARMA | Autoregressive Moving Average Model | 自回归-移动平均模型 | 基础的时间序列模型 |
BM | Beamforming Beamformer | 波束形成(器) | 多通道麦克风信号处理的一种常用方法。 |
BM | Block Matrix | 阻塞矩阵 | GSC方法里的概念。 |
DD | Decision-Directed Method | 判决引导法 | 估算参数值的一种方法。 |
Der | Dereverberation | 去混响 | 一般在处理室内声学信号时,经常存在混响,需要针对性的进行去混响。 |
DOA | Direction-Of-Arrival | 波达方向估计 | 估计信号相对于麦克风的方向。 |
DSB | Delay-and-Sum Beamformer | 延时相加波束形成器 | 波束形成方法。 |
Fs | Frequency of Sampling | 采样率 | 模数转换时的采样率,决定了频域处理的频段上限,满足奈奎斯特采样定律。 |
GSC | Generalized Sidelobe Cancellation | 广义旁瓣消除器 | 由 Griffiths 与 Jim 提出, 是一种自适应噪声消除算法 。 |
IBM | Ideal Binary Mask | 理想二值掩码 | 常用于语音降噪下进行噪声估计,比如现在深度学习下的降噪就用的很频繁。 |
IMCRA | Improved Minimum Controlled Regressive Average | 改进版递归式更新估计噪声。 | 一种噪声跟踪统计方法 |
IRM | Ideal Ratio Mask | 理想比值掩码 | 常用于语音降噪下进行噪声估计,比如现在深度学习下的降噪就用的很频繁。 |
ISTFT | Inverse Short-Time Fourier Transform | 逆短时傅里叶变换 | 将频域语音信号变化为时域信号 |
LCMV | Linearly Contrained Minimum Variance | 线性限制最小方差 | 一种计算固定波束形成系数的方法。 |
LMS | Least Mean Square | 最小均方自适应滤波器 | 自适应学习参数的方法。 |
LSA | Log-Spectral Amplitude | 对数谱幅度 | 估计语音信号。 |
MA | Moving Average model | 移动平均模型 | 基础的时间序列模型 |
MCLP | Multichannel Linear Prediction | 多通道线性预测模型 | 实现语音信号去混响的一种方法。 |
MCRA | the Minimum Controlled Regressive Average method | 递归式更新估计噪声 | 一种噪声跟踪统计方法。 |
MIMO | the Multiple-Input Multiple-Output system | 多通道输入多通道输出系统 | 语音处理系统输入输出通道数量的整体描述。 |
MISO | The Multiple-Input Single -Output system | 多通道输入单通道输出系统 | 语音处理系统输入输出通道数量的整体描述。 |
MMSE | Minimum Mean-Square Error | 最小均方误差 | 衡量评价指标的一种策略。 |
MOS | Mean Opinion Score | 平均意见得分 | 描述语音质量的指标,主观指标。 |
MS | Minimum Statistics | 最小统计跟踪 | 一种噪声跟踪统计方法。 |
MVDR | Minimum variance distortionless Response | 最小方差无失真响应 | 一种计算固定波束形成系数的方法。 |
NLMS | Normalized Least Mean Square | 归一化最小均方自适应滤波器 | 自适应学习参数的方法。 |
NS | Noise Suppression | 噪声抑制 | 就是语音降噪,另外一种叫法。 |
OM-LSA | the Optimally-Modified Log-Spectral Amplitude | 最优修正对数谱幅度 | 估计语音信号。 |
PESQ | Perceptual Evaluation of Speech Quality | 语音感知质量评价 | 最新评价语音质量的客观工具,将话音的频率、响度等物理特性与人类心理上的感知特性相对应关系用数学模型来表示, 即用客观的数学模型评价来模拟主观的评价。 |
PF | Post-Filter | 后置滤波 | 一般在去混响、固定波束形成或者GSC之后应用,也就是单通道降噪。 |
PSD | Power Spectrum Density | 功率谱密度 | 描述声学信号的谱特性。 |
RIR | Room Impulse Response | 房间冲击响应 | 参照RTF,具体的一种场景,常用于去混响问题。 |
RTF | Relative Transfer Functions | 相对传输函数 | 常用于描述两个位置之间的声学传递函数。 |
SAP | Speech Absence Probability | 语言不存在概率 | 相对于SPP。 |
SIMO | The Single-Input Multiple-Output system | 单通道输入多通道输出系统 | 语音处理系统输入输出通道数量的整体描述。 |
SISO | the Single-Input Single-Output system | 单通道输入单通道输出系统 | 语音处理系统输入输出通道数量的整体描述。 |
SNR | Signal-to-Noise Ratio | 信噪比 | 描述信号干净程度,越大越好。 |
SPP | Speech Presence Probability | 语言存在概率 | 当前时间段或者帧时的语音存在概率,常用于噪声跟踪。 |
STFT | Short-Time Fourier Transform | 短时傅里叶变换 | 一段完整的语音信号通常是非稳态的,即其特征基本上是随时间变化的,然而由于人的口腔与喉部发声的固有特性,在一个短时间范围内 ,一般为 之间,其特征基本保持不变,即语音信号是短时平稳的。所以在对语音信号进行频域分析时需要一帧一帧的处理,帧长一般取 。 |
TDOA | Time-Difference-Of-Arrival | 到达时间差 | 信号到达各个麦克风时间的时间差,常用于DOA。 |
TVG | Time-Varying Gaussian model | 时变高斯模型 | 一种描述语音信号的模型。 |
VAD | Voice Activity Detection | 语言激活检测 | 检查当前时间段或者帧时的语音存在概率,常用于噪声估计或者跟踪。 |
WNG | White Noise Gain | 白噪声增益 | 描述固定波束形成系数的稳定性的指标。 |
WPE | Weighted Prediction Estimation | 权重预测估计方法 | 日本学者Takuya Yoshioka在其学位论文中系统提出的一种去混响方法。 |
发布于昨天 11:35