[转载]MATLAB读取音频文件并进行音频特征提取

最新推荐文章于 2024-07-27 23:01:09 发布

Debatrix

最新推荐文章于 2024-07-27 23:01:09 发布

阅读量4.9w

点赞数 36

分类专栏： matlab 文章标签： matlab audioread

matlab 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

受教了

原文地址：MATLAB读取音频文件并进行音频特征提取作者：愚人

1、用audioread(”);函数读取电脑中的音频文件，参数是音频文件的路径：

[sampledata,FS] = audioread('F:1.mp3');

sampledata保存音频信号数据，FS是音频采样率，MP3格式的采样率一般为44100；

2、判断音频数据是否是双声道，如果是双声道则保留一个声道的数据，用calsample.m文件的函数完成此功能，文件内容如下：

function sample = calsample(sampledata,FS)
temp_sample = resample(sampledata,1,FS/11025);
[m,n] = size(temp_sample);
if (n == 2)
    sample = temp_sample(:,1);
else
    sample = temp_sample;
end
end

3、对音频数据进行快速傅里叶变换得到频谱图，并选取scope区域内的能量最大并且能量增幅最大的点作为峰值点，进行特征提取，keypoint.m文件内容如下：

function point = keypoint(sample,scope)
%对音频数据进行快速傅里叶变换，得到变换后的数据为b，频率为f，时间为t
[b,f,t] = specgram(sample,1024,11025,hanning(1024),256);
specgram(sample,1024,11025,hanning(1024),256);%绘制频谱图
hold on;
energy = abs(b);%根据快速傅里叶变换后的数据进行能量计算
%energy = sample;
diffenergy = caldiffenergy(energy);%计算能量差分
[m,n] = size(energy);%获取能量矩阵的大小
%f = (0:4);
%t = (0:4);
f_unit = max(f)/(length(f)-1);%根据频率点个数计算频率单位长度
t_unit = max(t)/(length(t)-1);%根据时间点个数计算时间单位长度
k = 1;
l = 1;
p = 1;
num = 1;
point.t = 0;
point.f = 0;%point结构体数组用来保存峰值点
temp.t = 0;
temp.f = 0;%temp结构体数组用来保存计算中的临时点
count = 0;%count为零表示在当前scope中未找到峰值点
x_f=0;
y_t=0;
plot(x_f,y_t);
hold on;
for i = 1:m-scope+1
    for j = 1:n-scope+1
        %找出大小为scope的子矩阵中的最大元素的位置并保存
        [x_f,y_t] = find(energy(i:i+scope-1,j:j+scope-1)==max(max(energy(i:i+scope-1,j:j+scope-1))));
        x_f = x_f + i - 1;
        y_t = y_t + j - 1;
        %找出大小为scope的子矩阵中的差分最大元素的位置并保存
        [diffx,diffy] = find(diffenergy(i:i+scope-1,j:j+scope-1)==max(max(diffenergy(i:i+scope-1,j:j+scope-1))));
        diffx = diffx + i - 1;
        diffy = diffy + j - 1;
        count = 0;
        %如果最大元素和差分最大元素都为同一个位置则该点为峰值点，保存在temp中
        for k = 1:length(x_f)
            for l = 1:length(diffx)
                if (x_f(k) == diffx(l)) && (y_t(k) == diffy(l))
                    temp(num).f = x_f(k) * f_unit;
                    temp(num).t = y_t(k) * t_unit;
                    %plot(temp(num).t,temp(num).f,'.');
                    num = num + 1;
                    count = 1;%在scope中找到一个峰值点则不再记录其它相同的点
                    break;
                end
            end
            if count == 1%scope中多个峰值点只保留第一个
                break;
            end
        end
    end
end
%将temp中保存的峰值点画在图上，多个scope中找到的相同峰值点只画一次
len = 1;
point(1).f = temp(1).f;
point(1).t = temp(1).t;
plot(point(1).t,point(1).f,'.');
for i = 2:num - 1
    for j = 1:len
        if (temp(i).f == point(j).f) && (temp(i).t == point(j).t)
            break;
        end
    end
    if j == len && (temp(i).f ~= point(j).f) && (temp(i).t ~= point(j).t)
        len = len + 1;
        point(len).f = temp(i).f;
        point(len).t = temp(i).t;
        plot(point(len).t,point(len).f,'.');
    end
end
hold off
end

4、keypoint(sample,scope);函数中用到的caldiffenergy(energy);函数内容在caldiffenergy.m文件中，内容如下：

function diffenergy = caldiffenergy(energy)
v = diff(energy');
[x,y] = size(v);
for i = 1:y
    zero(i) = 0;
end
diffenergy = abs(([zero;v])');
end

Debatrix

关注

36
点赞
踩
235

收藏

觉得还不错? 一键收藏
14
评论
[转载]MATLAB读取音频文件并进行音频特征提取

原文地址：MATLAB读取音频文件并进行音频特征提取作者：愚人
复制链接

扫一扫

专栏目录