1. 预备知识(基础概念)
详见 https://blog.csdn.net/shanx_s/article/details/52947007
详见 https://blog.csdn.net/Barry_J/article/details/80996564
2. 读取音频文件并进行音频特征提取
2.1 用audioread(”);函数读取电脑中的音频文件,参数是音频文件的路径:
[sampledata,FS] = audioread('F:1.mp3');
2.2 判断音频数据是否是双声道,如果是双声道则保留一个声道的数据,用calsample.m文件的函数完成此功能,程序如下:
function sample = calsample(sampledata,FS)
temp_sample = resample(sampledata,1,FS/22050);
[m,n] = size(temp_sample);
if (n == 2)
sample = temp_sample(:,1);
else
sample = temp_sample;
end
end
3. MFCC特征提取 (语音识别)
简单可以分为如下:
- 对音频信号预加重、分帧和加窗