前几天无意间看到一个项目rnnoise。
基于RNN的音频降噪算法。
采用的是 GRU/LSTM 模型。
阅读下训练代码,可惜的是作者没有提供数据训练集。
不过基本可以断定他采用的数据集里,肯定有urbansound8k。
urbansound8k 数据集地址:
也可以考虑采用用作者训练的模型来构建数据集的做法,不过即费事,也麻烦。
经过实测,降噪效果很不错,特别是在背景噪声比较严重的情况下。
不过作者仅仅提供 pcm 的代码示例,并且还只支持48K采样率,
( 明显是为了兼容其另一个 项目 opus)
在很多应用场景下,这很不方便。
尽管稍微有点麻烦,但是事在人为,花了点时间,稍作修改。
具体修改如下:
1.支持wav格式
2.支持全部采样率
采样率的处理问题,采用简单粗暴法,
3.增加CMake文件
4.增加测试用 示例音频sample.wav
贴上完整示例代码 :
#include
#include "rnnoise.h"
#include
#include
#define DR_WAV_IMPLEMENTATION
#include "dr_wav.h"
void wavWrite_int16(char *filename, int16_t *buffer, int sampleRate, uint32_t totalSampleCount) {
drwav_data_format format;
format.container = drwav_container_riff;
format.format = DR_WAVE_FORMAT_PCM;
format.channels = ;
format.sampleRate = (drwav_uint32) sampleRate;
format.bitsPerSample = ;
drwav *pWav = drwav_open_file_write(filename, &format);
if (pWav) {
drwav_uint64 samplesWritten = drwav_write(pWav, totalSampleCount, buffer);
drwav_uninit(pWav);
if (samplesWritten != totalSampleCount) {
fprintf(stderr, "ERROR\n");
exit();
}
}
}
int16_t *wavRead_int16(char *filename, uint32_t *sampleRate, uint64_t *totalSampleCount) {
unsigned int channels;
int16_t *buffer = drwav_open_and_read_file_s16(filename, &channels, sampleRate, totalSampleCount);
if (buffer == NULL) {
fprintf(stderr, "ERROR\n");
exit();
}
) {
drwav_free(buffer);
buffer = NULL;
*