声纹识别
文章平均质量分 92
郭小儒
是个好看的笨蛋
展开
-
声纹识别_加入噪声
我们需要计算原始音频的RMS和噪声音频的RMS,为了能得到规定的SNR,我们需要修改噪声的RMS值,办法就是将每个噪声元素都乘上一个常数,这样就能使得噪声的RMS值也乘上一个常数,达到需要的噪声RMS。学习如何将噪声加入到audio data中,后续可以将不同SNR的噪声加入原始信号样本,评估不同噪声条件下的模型性能。首先读取原始audio.wav(里面是一段话:“leave my dog alone”)噪声是服从高斯分布,均值为0,标准差是。将有噪声的音频加入到原始音频中。原创 2024-01-02 12:38:26 · 1407 阅读 · 0 评论 -
声纹识别资源汇总(不断更新)
speaker identification的概念就是拍段一段语音是谁所说,说话人辨认分为开集辨认和闭集辨认,当确定说话人在注册声纹库里时,是一个N选一的有限范围选一个的闭集任务,当不确定当前音频是否在注册声纹库里时,是一个开集任务。开集比闭集的要难很多。Speaker Recognition是一个大方向,包含说话人验证(speaker verification),说话人辨认(speaker identification),说话人分离(diarization)等小方向,本项目中需要的是说话人辨认这个方向。原创 2024-01-02 12:26:23 · 1873 阅读 · 0 评论 -
基于d-vector的声纹识别(作为初学者的小总结)
目的是使用d-vectors来创建声纹识别(speaker identification)和分离系统(speaker diarization)d-vector顾名思义就是一个从音频中提取出来的矩阵,就是把这个d-vector代表一个人的“声音指纹”d-vector使用DNN提取出来的,为了提取d-vector,DNN模型采用堆叠的滤波器组特征(这是啥意思?原创 2023-12-22 16:54:50 · 1119 阅读 · 1 评论