1 内容介绍

说话人识别是当前语音识别的研究热点之一。本文主要研究了以下几个方面:说话人语音识别系统,对能够反映人对语音感知特性的Mel频率倒谱系数(MFCC)作为特征参数进行提取。同时,分析了最近邻KNN。实验结果表明,KNN对训练的语音样本有着很高的分类准确率。

2 部分代码

function fileList = getAllFiles(foldername)%

folderData = dir(foldername);      

folderIndex = [folderData.isdir];  

fileList = {folderData(~folderIndex).name}';  

if ~isempty(fileList)

    fileList = cellfun(@(x) fullfile(foldername,x),...  

        fileList,'UniformOutput',false);

end

subfolders = {folderData(folderIndex).name};  

errIndex = ~ismember(subfolders,{'.','..'});  

for iDir = find(errIndex)                 

    nextDir = fullfile(foldername,subfolders{iDir});   

    fileList = [fileList; getAllFiles(nextDir)];  

end 

3 运行结果

【语音识别-说话人识别】基于MFCC结合Mel频率倒谱系数实现垃圾分类附matlab代码_matlab代码

【语音识别-说话人识别】基于MFCC结合Mel频率倒谱系数实现垃圾分类附matlab代码_说话人识别_02

4 参考文献

[1]曹辉, 徐晨, 赵晓,等. 说话人识别中的Mel特征频率倒谱系数[J]. 西北大学学报(自然科学版), 2013, 43(002):203-208.

[2]于树本. 基于MFCC的说话人语音识别系统的研究[J]. 黑龙江科技信息, 2015.

部分理论引用网络文献,若有侵权联系博主删除。