基于BP网络的语音识别

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

该BP网络结构是24-25-4

数据链接链接:https://pan.baidu.com/s/1MwlY51y5HTWNwzqB_DoSsw 
提取码:abcd

%% 清空环境变量

clc
clear

%% 训练数据预测数据提取及归一化

%下载四类语音信号

load data1 c1 %这里的数据都是被处理过的,由音频转为了矩阵
load data2 c2
load data3 c3
load data4 c4

%四个特征信号矩阵合成一个矩阵

data(1:500,:)=c1(1:500,:);
data(501:1000,:)=c2(1:500,:);
data(1001:1500,:)=c3(1:500,:);
data(1501:2000,:)=c4(1:500,:);

%从1到2000间随机排序

k=rand(1,2000);
[m,n]=sort(k);%返回的m是升序的矩阵,n是对应原来矩阵的索引

%输入输出数据

input=data(:,2:25);%2:25列是数据特征
output1 =data(:,1);%第一列是数据对应的序号(等于类别)

%把输出从1维变成4维

output=zeros(2000,4);%建立一个2000*4的矩阵
for i=1:2000 
    switch output1(i)
        case 1
            output(i,:)=[1 0 0 0];
        case 2
            output(i,:)=[0 1 0 0];
        case 3
            output(i,:)=[0 0 1 0];
        case 4
            output(i,:)=[0 0 0 1];
    end
end

%随机提取1500个样本为训练样本,500个样本为预测样本

input_train=input(n(1:1500),:)';
output_train=output(n(1:1500),:)';
input_test=input(n(1501:2000),:)';
output_test=output(n(1501:2000),:)';

%输入数据归一化

[inputn,inputps]=mapminmax(input_train);%inputn训练样本,

%% 网络结构初始化

innum=24;%输入层
midnum=25;%隐藏层
outnum=4;%输出层



%权值初始化

w1=rands(midnum,innum);%[25*24]
b1=rands(midnum,1);%[25*1]
w2=rands(midnum,outnum);%[25*4]
b2=rands(outnum,1);%[4*1]
w2_1=w2;w2_2=w2_1;%隐藏层到输出层
w1_1=w1;w1_2=w1_1;%输入层到隐藏层
b1_1=b1;b1_2=b1_1;%隐藏层阈值
b2_1=b2;b2_2=b2_1;%输出层阈值

%学习率

xite=0.1;%学习率
alfa=0.01;
loopNumber=10;%计算几次
I=zeros(1,midnum);%[25*1]'
Iout=zeros(1,midnum);
FI=zeros(1,midnum);
dw1=zeros(innum,midnum);%[25*24]'
db1=zeros(1,midnum);

%% 网络训练

E=zeros(1,loopNumber);%[1*10]
for ii=1:loopNumber
    E(ii)=0;%计算每一轮的误差
    for i=1:1:1500
       %% 网络预测输出 
        x=inputn(:,i);
        % 隐含层输出
        for j=1:1:midnum
            I(j)=inputn(:,i)'*w1(j,:)'+b1(j);
            Iout(j)=1/(1+exp(-I(j)));
        end
        % 输出层输出
        yn=w2'*Iout'+b2;
        
       %% 权值阀值修正
        %计算误差
        e=output_train(:,i)-yn;     
        E(ii)=E(ii)+sum(abs(e));
        
        %计算权值变化率
        dw2=e*Iout;
        db2=e';
        
        for j=1:1:midnum
            S=1/(1+exp(-I(j)));
            FI(j)=S*(1-S);
        end      
        for k=1:1:innum
            for j=1:1:midnum
                dw1(k,j)=FI(j)*x(k)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4));
                db1(j)=FI(j)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4));
            end
        end
           
        w1=w1_1+xite*dw1';
        b1=b1_1+xite*db1';
        w2=w2_1+xite*dw2';
        b2=b2_1+xite*db2';
        
        w1_2=w1_1;w1_1=w1;
        w2_2=w2_1;w2_1=w2;
        b1_2=b1_1;b1_1=b1;
        b2_2=b2_1;b2_1=b2;
    end
end


 

%% 语音特征信号分类

inputn_test=mapminmax('apply',input_test,inputps);
fore=zeros(4,500);
for ii=1:1
    for i=1:500%1500
        %隐含层输出
        for j=1:1:midnum
            I(j)=inputn_test(:,i)'*w1(j,:)'+b1(j);
            Iout(j)=1/(1+exp(-I(j)));
        end
        
        fore(:,i)=w2'*Iout'+b2;
    end
end

%% 结果分析
%根据网络输出找出数据属于哪类

output_fore=zeros(1,500);
for i=1:500
    output_fore(i)=find(fore(:,i)==max(fore(:,i)));
end

%BP网络预测误差

error=output_fore-output1(n(1501:2000))';

%画出预测语音种类和实际语音种类的分类图

figure(1)
plot(output_fore,'r')
hold on
plot(output1(n(1501:2000))','b')
legend('预测语音类别','实际语音类别')

%画出误差图

figure(2)
plot(error)
title('BP网络分类误差','fontsize',12)
xlabel('语音信号','fontsize',12)
ylabel('分类误差','fontsize',12)

%print -dtiff -r600 1-4
%print -dtiff -r600 1-4

k=zeros(1,4);

%找出判断错误的分类属于哪一类

for i=1:500
    if error(i)~=0
        [b,c]=max(output_test(:,i));
        switch c
            case 1 
                k(1)=k(1)+1;
            case 2 
                k(2)=k(2)+1;
            case 3 
                k(3)=k(3)+1;
            case 4 
                k(4)=k(4)+1;
        end
    end
end

%找出每类的个体和

kk=zeros(1,4);
for i=1:500
    [b,c]=max(output_test(:,i));
    switch c
        case 1
            kk(1)=kk(1)+1;
        case 2
            kk(2)=kk(2)+1;
        case 3
            kk(3)=kk(3)+1;
        case 4
            kk(4)=kk(4)+1;
    end
end

%正确率

rightridio=(kk-k)./kk;
disp('正确率')
disp(rightridio);

源自:《Matlab神经网络43个案例分析》。

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值