音频AI降噪算法

音视频工具站

已于 2024-04-28 10:23:13 修改

阅读量1.8k

点赞数 11

文章标签：人工智能音视频

于 2024-02-20 11:33:11 首次发布

本文链接：https://blog.csdn.net/unique_no1/article/details/136186552

版权

噪声抑制

噪声抑制是语音处理中非常古老的话题，它主要的思想是在保证我们感兴趣的语音部分尽可能不被扭曲的前提下，将混合信号中的噪声尽可能消除。

今天我们主要介绍下AI降噪比较，AI降噪目前效果比较好的就属大模型算法了，我在实际应用过程中，对比过webrtc的降噪算法，在某些背景噪音比较大的情况下，webrtc的降噪算法效果就不是很好了，但是AI算法降噪效果还是比较不错的。

AI降噪算法

主要包括训练部分和降噪部分，它会先从语音和噪音语料里提取特征数据，再用这些数据训练，得到一个能把语音信号和噪声信号区分开来的模型，然后用得到的模型对输入的音频信号进行处理，在很多情况下都能得到良好的降噪效果。

AI降噪算法缺点：

虽然AI降噪比较牛，在某些情况下也降噪效果比普通降噪算法要好，但是缺点也比较明显，就是在噪音比较大的时候，有时会有损伤正常的音频，会有吞字的现象，这个就需要对算法进行针对性优化了。

以下是Demo测试的代码，可做参考，亲测效果还可以，目前可以支持8k、16k、48k采样率的pcm数据。

int main(int argc, char **argv) {
  int i;
  int first = 1;
  float x[FRAME_SIZE];
  FILE *f1, *fout;
  DenoiseState *st;
  st = ainoise_create(NULL);
  if (argc!=3) {
    fprintf(stderr, "usage: %s <noisy speech> <output denoised>\n", argv[0]);
    return 1;
  }
  f1 = fopen(argv[1], "rb");
  fout = fopen(argv[2], "wb");
  while (1) {
    short tmp[FRAME_SIZE];
    fread(tmp, sizeof(short), FRAME_SIZE, f1);
    if (feof(f1)) break;
    for (i=0;i<FRAME_SIZE;i++) x[i] = tmp[i];
    ainoise_process_frame(st, x, x);
    for (i=0;i<FRAME_SIZE;i++) tmp[i] = x[i];
    if (!first) fwrite(tmp, sizeof(short), FRAME_SIZE, fout);
    first = 0;
  }
  ainoise_destroy(st);
  fclose(f1);
  fclose(fout);
  return 0;
}

examples目录： ./ainoise_demo sample.wav sample_out.wav