谱减法根据无声段统计噪声得到的方差,作为当前帧的噪声估计谱,当某帧的噪声分量较大时,则谱减后会有噪声残留,增强后的语音在频谱上有随机尖峰出现,即夹杂着有节奏的音乐噪声(传统谱减法的主要缺点)。并且由于算法的特殊性,谱减法只能对有限长语音信号进行去噪,即需要对音频进行截取处理,这导致其不适 用于对语音进行实时去噪。
噪声不知道所以对噪声进行估计!
一般情况下,噪声为加性噪声,处于开始那端!
时间上一帧一帧的相减!!
语音信号具有短时不变性,时间短的时候具有周期性。所以用STFT
每一个点表示一个频率成分!!频率点相减
20-40帧 取均值
不管哪个t,噪声都是一样的!!
Mag 幅度
效果原因有两个:一是噪声取得均值啥的不好,,因为前30秒都没搞干净。
- 频率内如果是上图那样(有增有减门函数),在时域会变成sin函数,时域有截断效应,往回变是把信号截短。截短后再进行傅里叶变换,然而截短会导致频谱泄露。iSTFT之后做STFT,可能会导致震荡衰减。边角还会产生尖峰。
所以说硬减效果并不好,因为估计的噪声本就不准确,会产生音乐噪声的现象。
直接谱减并不好用!!
不连续,想办法平滑一下。
使用的是相邻帧的最小值!!