防御对抗样本的方法
重采样
重采样的过程如下:
首先假设对抗样本的音频格式的采样率为16khz
- 首先对音频进行下采样,下降到8khz的音频
- 假设原始音频的采样率为Q,目标音频的采样率为P,则下采样就是对原始音频每隔Q/P-1个取一个点
- 如上面的16khz下采样到8khz就是媚间隔1个点采样一次,这样采样结束后与原对抗样本相比少了一个采样点
- 然后再通过插值的方法进行上采样,通过插值方式插入
降噪-谱减法
谱减法原理:
- 假定噪声都是加性噪声,用原始音频的频谱减去噪声的频谱剩下的就是存粹的语音了,原论文中之间把一段音频的前5帧认为是无语音的被噪声部分,把一段音频的前5帧的噪声进行取平均值。然后用原始音频减去平均值即可。
优点:
- 谱减法具有算法简单、运算量小的特点,便于实现快速处理,往往能够获得较高的输出信噪比,所以被广泛采用。
缺点:
- 该算法经典形式的不足之处是处理后会产生具有一定节奏性起伏、听上去类似音乐的“音乐噪声”。
过程图