声纹识别
文章平均质量分 53
声音识别、自然语言处理、变压器声纹识别
强heaven
1996-2000 交通大学
展开
-
[声纹识别]基于MFCC的声纹识别算法
基于MFCC的声纹识别算法 Mel频率倒谱系数(melfrequency cepstral coefficients,MFCC)是声音的短期功率谱的表示,基于非线性频谱上的对数功率谱的线性余弦变换。在自动语音识别领域,MFCC是使用最广泛的特征之一,同时,它也广泛应用于声纹识别领域。MFCC特征提取过程,如图1所示。图 1 MFCC特征提取过程1)对原始语音进行预加重、分帧和加窗等预处理操作,得到短时信号x(n);2)对每一个短时信号x(n)进行快速傅里叶变换(FFT)得到...原创 2021-10-17 12:03:29 · 3998 阅读 · 1 评论 -
[声纹识别]语音识别系统框架[1]
在研究者眼中的语音识别是通过三个步骤完成:一是录入语音信号;二是搜素训练数据集包含(声音模型、词库、语言模型);三是解码输出文本。也就是说音频->提取为声学特征->转成音素(这部分为声学模型)->组成字/词->按时序组成句子(这部分为语言模型)。 所谓语音识别,就是将一段语音信号转换成相对应的文本信息,语音识别系统主要包含特征提取、声学模型,语言模型以及字典与解码四大部分,此外为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等音频...原创 2021-10-16 21:40:09 · 2303 阅读 · 0 评论 -
[声纹识别]“说话人识别”基本概念
“声纹识别”也叫“说话人识别”。就是从某段语音中识别出说话人的身份的过程;声纹与指纹类似,每个人说话过程中蕴含的语言特征和发音习惯等也几乎是唯一的。 声纹识别与语音识别区别是:语音识别是共性知识,判断所说的内容(说的什么);声纹识别是个性识别,判断说话人身份(即是谁说的)。 进一步强调两个概念:声纹和声纹识别(或说话人识别) 。声纹指语音中所蕴含的唯一表征说话人身份的语音特征参数及基于这些特征参数所建立的语音模型; 声...原创 2021-10-16 00:18:40 · 1503 阅读 · 0 评论 -
[声纹识别]语音识别的发展史
语音识别研究经历了知识积累、模板匹配、模式识别、统计模型、机器学习和深度学习等五个发展阶段[1]。 1.知识积累阶段,20世纪30-50年代,针对特定语音或小词表的孤立词,设计专门的语音识别算法或装置。 2.模板匹配阶段,50-60年代,基于声学和语音学知识设计语音识别系统,主要使用模板匹配方法识别音位、音素和数字。 3.模式识别阶段,60-80年代,使用模式识别方法进行中小规模的孤立词或连续词串语音识别。 4.统计模型阶段,1980-...原创 2021-10-15 23:56:25 · 2911 阅读 · 0 评论