一个简单的BP神经网络matlab程序（附函数详解）

最新推荐文章于 2024-08-14 10:35:52 发布

hubery_zhang

最新推荐文章于 2024-08-14 10:35:52 发布

阅读量9.5w

点赞数 64

分类专栏：算法理论文章标签： mapminmax newff BP神经网络 matlab 函数

本文链接：https://blog.csdn.net/ckzhb/article/details/60571769

版权

算法理论专栏收录该内容

33 篇文章 9 订阅

订阅专栏

说明：20180604更新

1、此文的程序来自博客：http://www.cnblogs.com/heaad/archive/2011/03/07/1976443.html

2、本人对其中涉及到的函数进行了详细说明。

3、此程序中部分函数的使用方式是高版本Matlab中不推荐的

文中给出了当前高版本Matlab中的使用方式，并给出了相关博客地址，具体如下：

归一化方式mapminmax : http://blog.csdn.net/lkj345/article/details/50352385

newff函数的使用： http://www.cnblogs.com/xxfcz/p/4482813.html

4、使用过程中，可能出现的问题

https://blog.csdn.net/ckzhb/article/details/78615712

5、所需的IRIS数据集

https://download.csdn.net/download/ckzhb/10458430

https://github.com/xiaoxiaoxiaohui/Resource/tree/master/水仙花数据集

具体程序如下：

%读取训练数据
[f1,f2,f3,f4,class] = textread('trainData.txt' , '%f%f%f%f%f',150);

%特征值归一化
[input,minI,maxI] = premnmx( [f1 , f2 , f3 , f4 ]')  ;

%构造输出矩阵
s = length( class) ;
output = zeros( s , 3  ) ;
for i = 1 : s 
   output( i , class( i )  ) = 1 ;
end

%创建神经网络
net = newff( minmax(input) , [10 3] , { 'logsig' 'purelin' } , 'traingdx' ) ; 

%设置训练参数
net.trainparam.show = 50 ;
net.trainparam.epochs = 500 ;
net.trainparam.goal = 0.01 ;
net.trainParam.lr = 0.01 ;

%开始训练
net = train( net, input , output' ) ;

%读取测试数据
[t1 t2 t3 t4 c] = textread('testData.txt' , '%f%f%f%f%f',150);

%测试数据归一化
testInput = tramnmx ( [t1,t2,t3,t4]' , minI, maxI ) ;

%仿真
Y = sim( net , testInput ) 

%统计识别正确率
[s1 , s2] = size( Y ) ;
hitNum = 0 ;
for i = 1 : s2
    [m , Index] = max( Y( : ,  i ) ) ;
    if( Index  == c(i)   ) 
        hitNum = hitNum + 1 ; 
    end
end
sprintf('识别率是 %3.3f%%',100 * hitNum / s2 )

详细说明：

1、文本文件读取函数

textread() 读取文件中数据，%f表示读取单浮点数，按列依次将数据存入f1、f2、f3……。这里f1—f4代表四个特征，class代表每组数据所属的类别。

这里的每列是一个属性/特征的所有输入值，并不是后面函数中输入的一组样本数据。

而在程序中 premnmx、newff、train、tramnmx都是以列的形式输入每组样本数据，故在归一化时需要转置。

2、归一化处理函数

premnmx()将原始数据归一化到-1到1之间，该函数在高版本的MATLAB中已被废弃。

[input,minI,maxI] = premnmx（P）

premnmx()对行归一化，故需要将textread读取的原始数据进行转置，此时矩阵P是4行75列的（4个属性，75组训练样本）。

minI,maxI均是4行1列，这两个是为了后面的测试数据的归一化。

input是归一化后的矩阵4行75列。后面神经网络创建的newff函数的第一个参数是一个Rx2的矩阵以定义R个输入向量(即输入层节点个数-输入特征值个数)的最小值和最大值。

推荐使用mapminmax进行归一化：该函数也是对行归一化！！！

http://blog.csdn.net/lkj345/article/details/50352385

https://blog.csdn.net/ckzhb/article/details/72871140

例子：[inputn,setting]=mapminmax(input_train);

3、输出矩阵

%构造输出矩阵
s = length( class ) ;
output = zeros( s , 3  ) ; %zeros(s,3)生成s乘3的全零阵。即75行3列     
for i = 1 : s
   output( i , class( i )  ) = 1 ;
end

output是75行3列。class矩阵是75行1列，前几列是1，中间是2，最后是3.（即三种花的类型）。数据集中第一种花标记为1，第二种花记为2，第三种花记为3，这样经过循环后，output依然是75行3列，第一列的前几行全为1，第二列的中间几行全为1，第三列的最后几行全为1，其余均为0.

目的是：神经网络输出需要根据类别数量进行一定的处理，有几种类别输出层便含有几个结点，即第一种花输出为[1 0 0]，第二种花输出为[0 1 0]，第三种花输出为[0 0 1]。这里output每一行对应一组样本的输出类别，通过一个for循环，将所述的类所在的列置为1，此时output是75行3列的。后续train()函数所需的输出标签要求每一列对应一组数据的类别，故后续需要将output转置。

4、神经网络构建

net = newff( minmax(input) ,[10 3] , { 'logsig' 'purelin' } , 'traingdx' )

（此例是老版本的使用http://blog.sina.com.cn/s/blog_64b046c70101cko4.html）

旧版newff函数的格式为：

net=newff(PR,[S1S2 ...SN],{TF1 TF2...TFN},BTF,BLF,PF），函数newff建立一个可训练的前馈网络。输入参数说明：

PR：Rx2的矩阵以定义R个输入向量的最小值和最大值；

Si：第i层神经元个数；

TFi：第i层的传递函数，默认函数为tansig函数；

BTF：训练函数，默认函数为trainlm函数；

traingdx表示学习率自适应并附加动量因子的最速下降法

BLF：权值/阈值学习函数，默认函数为learngdm函数；

PF：性能函数，默认函数为mse函数。