声纹识别
声纹识别
SoWhat1412
微信搜索【SoWhat1412】,第一时间阅读原创干货文章。人之患、在好为人师、不实知、谨慎言。点点滴滴、皆是学问、看到了、学到了、便是收获、便是进步。
展开
-
【声纹识别】MFCC梅尔频率倒谱系数学习笔记
简要说下流程1)先对语音进行预加重、分帧和加窗;(加强语音信号性能(信噪比,处理精度等)的一些预处理)2)对每一个短时分析窗,通过FFT得到对应的频谱;(获得分布在时间轴上不同时间窗内的频谱)3)将上面的频谱通过Mel滤波器组得到Mel频谱;(通过Mel频谱,将线形的自然频谱转换为体现人类听觉特性的Mel频谱)4)在Mel频谱上面进行倒...原创 2017-09-07 13:57:28 · 4122 阅读 · 0 评论 -
【声纹识别】 EER
FRR(False Rejection Rate)和FAR(False Acceptance Rate)是用来评估指纹识别算法性能的两个主要参数。 FRR通俗叫法是拒真率的意思,标准称谓是 FNMR(False Non-Match Rate 不匹配率)。可以通俗的理解为“把应该相互匹配成功的指纹当成不能匹配的指纹”的概率。 Equal Error Rate ,...原创 2017-11-22 19:33:01 · 10320 阅读 · 3 评论 -
【声纹识别】matlab-辨别男女声
function man_or_woman(file)[x,fs]=audioread(file); % 读入声音文件%======时域图像====== 随着时间声音赋值震荡图data=x(:,1); %取单声道n=0:length(x)-1; %建立一个信号等长的序列time=n/fs; %建立时间序列,作为横坐标f...原创 2018-04-17 13:33:28 · 13364 阅读 · 15 评论 -
【声纹识别】DTW算法
DTW python实现算法 ->github(dtw)DTW的原理 可以参考这篇文章,写的很详细。http://www.cnphp6.com/archives/60574这篇文章是没有代码的,我用C语言实现了文章里的描述的DTW方法,为了方便对照原理和代码,我将文章粘贴过来,然后附上C代码。原理在大部分的学科中,时间序列是数据的一种常见表示形式。对于时间序列处理来说,一个...转载 2018-05-04 15:02:46 · 5407 阅读 · 3 评论 -
【声纹识别】 kaldi callhome diarization
callhome diarization kaldi 中专门用来进行混合录音文件聚类分别的,主要参考blog-->操作指南学会自己看kaldi中的 指令demo。个人操作如下:teps/segmentation/detect_speech_activity.sh --cmd 'run.pl' --nj 1 --mfcc-config ./conf/mfcc_hires.co...原创 2019-03-01 14:16:48 · 19150 阅读 · 13 评论