基于MFCC参数的元音识别
一、需求分析
利用MFCC参数,对元音进行比对。读取每个元音的WAV文件,然后进行分帧,这里分帧的时候将重叠部分设置为0,即帧长wlen=256,帧移inc=256。每帧有256个数。
比对内容:1、同一个WAV文件的不同两帧进行对比;2、不同WAV文件的两帧进行对比。
比对方法:1、将两帧中每帧的12个mfcc参数相减,相减后求绝对值,画出波形,观察;2、将绝对值后的12个参数求和观察大小。
二、具体流程
三、元音比对
1、元音a的第一帧和第三帧的比对
元音a的第三帧的12个mfcc参数和a的第一帧的12个mfcc参数分别为:
二帧相减后求绝对值并画出波形为:
二帧相减后求绝对值再求和的结果为:19.8824
2、元音u的第一帧和第三帧的比对
元音u的第一帧的12个mfcc参数和u的第三帧的12个mfcc参数分别为:
二帧相减后求绝对值并画出波形为:
二帧相减后求绝对值再求和的结果为:19.3398
3、元音a的第一帧和元音u的第一帧的比对
元音a的第一帧的12个mfcc参数和u的第一帧的12个mfcc参数分别为: