声学前端信号处理常用名词及缩写

欢迎来我的知乎专栏进一步探讨交流。

https://www.zhihu.com/column/c_1287066237843951616


学习过程中,碰到了很多声学前端信号处理名词的专用简写,特此记录下,欢迎各位知友批评与指点。

每个概念深究的话,均是可以单独成章的,后续有时间的话再进行细化。

会不断更新与完善。。

 

缩写全称中文释义应用场景
ABFAdaptive Beamformer自适应波束形成器波束形成方法。
AGCAutomatic Gain Control自动增益控制为了使输出的语音信号增益尽量保持稳定,避免忽大忽小,需要进行自动增益控制。
ARAutoregressive model自回归模型基础的时间序列模型
ARMAAutoregressive Moving Average Model自回归-移动平均模型基础的时间序列模型
BMBeamforming Beamformer波束形成(器)多通道麦克风信号处理的一种常用方法。
BMBlock Matrix阻塞矩阵GSC方法里的概念。
DDDecision-Directed Method判决引导法估算参数值的一种方法。
DerDereverberation去混响一般在处理室内声学信号时,经常存在混响,需要针对性的进行去混响。
DOADirection-Of-Arrival波达方向估计估计信号相对于麦克风的方向。
DSBDelay-and-Sum Beamformer延时相加波束形成器波束形成方法。
FsFrequency of Sampling采样率模数转换时的采样率,决定了频域处理的频段上限,满足奈奎斯特采样定律。
GSCGeneralized Sidelobe Cancellation广义旁瓣消除器由 Griffiths 与 Jim 提出, 是一种自适应噪声消除算法 。
IBMIdeal Binary Mask理想二值掩码常用于语音降噪下进行噪声估计,比如现在深度学习下的降噪就用的很频繁。
IMCRAImproved Minimum Controlled Regressive Average改进版递归式更新估计噪声。一种噪声跟踪统计方法
IRMIdeal Ratio Mask理想比值掩码常用于语音降噪下进行噪声估计,比如现在深度学习下的降噪就用的很频繁。
ISTFTInverse Short-Time Fourier Transform逆短时傅里叶变换将频域语音信号变化为时域信号
LCMVLinearly Contrained Minimum Variance线性限制最小方差一种计算固定波束形成系数的方法。
LMSLeast Mean Square最小均方自适应滤波器自适应学习参数的方法。
LSALog-Spectral Amplitude对数谱幅度估计语音信号。
MAMoving Average model移动平均模型基础的时间序列模型
MCLPMultichannel Linear Prediction多通道线性预测模型实现语音信号去混响的一种方法。
MCRAthe Minimum Controlled Regressive Average method递归式更新估计噪声一种噪声跟踪统计方法。
MIMOthe Multiple-Input Multiple-Output system多通道输入多通道输出系统语音处理系统输入输出通道数量的整体描述。
MISOThe Multiple-Input Single -Output system多通道输入单通道输出系统语音处理系统输入输出通道数量的整体描述。
MMSEMinimum Mean-Square Error最小均方误差衡量评价指标的一种策略。
MOSMean Opinion Score平均意见得分描述语音质量的指标,主观指标。
MSMinimum Statistics最小统计跟踪一种噪声跟踪统计方法。
MVDRMinimum variance distortionless Response最小方差无失真响应一种计算固定波束形成系数的方法。
NLMSNormalized Least Mean Square归一化最小均方自适应滤波器自适应学习参数的方法。
NSNoise Suppression噪声抑制就是语音降噪,另外一种叫法。
OM-LSAthe Optimally-Modified Log-Spectral Amplitude最优修正对数谱幅度估计语音信号。
PESQPerceptual Evaluation of Speech Quality语音感知质量评价最新评价语音质量的客观工具,将话音的频率、响度等物理特性与人类心理上的感知特性相对应关系用数学模型来表示, 即用客观的数学模型评价来模拟主观的评价。
PFPost-Filter后置滤波一般在去混响、固定波束形成或者GSC之后应用,也就是单通道降噪。
PSDPower Spectrum Density功率谱密度描述声学信号的谱特性。
RIRRoom Impulse Response房间冲击响应参照RTF,具体的一种场景,常用于去混响问题。
RTFRelative Transfer Functions相对传输函数常用于描述两个位置之间的声学传递函数。
SAPSpeech Absence Probability语言不存在概率相对于SPP。
SIMOThe Single-Input Multiple-Output system单通道输入多通道输出系统语音处理系统输入输出通道数量的整体描述。
SISOthe Single-Input Single-Output system单通道输入单通道输出系统语音处理系统输入输出通道数量的整体描述。
SNRSignal-to-Noise Ratio信噪比描述信号干净程度,越大越好。
SPPSpeech Presence Probability语言存在概率当前时间段或者帧时的语音存在概率,常用于噪声跟踪。
STFTShort-Time Fourier Transform短时傅里叶变换一段完整的语音信号通常是非稳态的,即其特征基本上是随时间变化的,然而由于人的口腔与喉部发声的固有特性,在一个短时间范围内 ,一般为 之间,其特征基本保持不变,即语音信号是短时平稳的。所以在对语音信号进行频域分析时需要一帧一帧的处理,帧长一般取 。
TDOATime-Difference-Of-Arrival到达时间差信号到达各个麦克风时间的时间差,常用于DOA。
TVGTime-Varying Gaussian model时变高斯模型一种描述语音信号的模型。
VADVoice Activity Detection语言激活检测检查当前时间段或者帧时的语音存在概率,常用于噪声估计或者跟踪。
WNGWhite Noise Gain白噪声增益描述固定波束形成系数的稳定性的指标。
WPEWeighted Prediction Estimation权重预测估计方法日本学者Takuya Yoshioka在其学位论文中系统提出的一种去混响方法。

 


 

发布于昨天 11:35

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

凌云之程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值