- 问题描述
公路运量主要包括公路客运量和公路货运量两个方面。据研究,某地区的公路运量主要与该地区的人数、机动车数量和公路面积有关,表2-1给出了某地区20年的公路运量相关数据。
根据相关部门数据,该地区2010年和2011年的人数分别为73.39和75.55万人,机动车数量分别为3.9635和4.0975万辆,公路面积分别为0.988 0和1.026 8万平方公里。请利用BP网络预测该地区2010年和2011年的公路客运量和公路货运量。
- 概要设计
把问题分成以下6个模块进行处理:
①原始数据的输入;
②数据归一化;
③网络训练;
④对原始数据进行仿真;
⑤将原始数据仿真的结果与已知样本进行对比;
⑥对新数据进行仿真。 - 详细设计
MATLAB应用于BP神经网络进行货运量组合预测计算,其主要计算步骤如下。
3.1数据预处理
由于神经元的响应函数为Sigmoid函数,因此输入值(输出值)都在(0,1)之间,必须对样本进行预处理。具体可以采用下式对单项预测值进行预处理:
y=0.6+0.3(X-Xmax) (6)
输出值的处理为:
X=(Y-0.6)Xmax/0.3 (7)
据式(7)进行处理之后,即可得到预测值。
3.2确定网络结构,初始化权重
确定网络结构主要是确定隐层的神经元个数。隐层神经元个数太多会降低网络的泛化功能,而且会使训练时间加长,降低系统的效率;太少则不能达到所要求的训练误差。一般根据试算确定,也可以参考以下公式: ,其中l为隐层神经元个数,n、m分别为输入神经元个数和输出神经元个数。
初始化网络的权值和阈值,可以采用MATLAB提供的初始化函数newff()建立一个BP神经网络:=net=newff(P,[S1,S2 …,SN],[TF1,TF2,…, TN1],BTF,BLF ,PF)
式中,P为输入矩阵;[S1 ,,S2,…,SV]表示隐含层和输出层神经元的个数;[TF1 ,TF2,…, TN1]表示网络隐含层和输出层的传输函数;BTF表示网络的反向训练函数;BLF表示网络的反向权值学习函数;PF表示性能数;net为新生成的BP神经网络。
3.3网络训练
MATLAB提供了许多训练不同神经网络的函数,使得对神经网络的训练变得异常简单,其中,由动量的梯度下降法中附以自适应Ir的训练函数为traingdx,函数的结构为:
net=newff(P,[S1 , S2 ,…,SN],[TF1 ,TF2 ,…, T’N1]。‘traingdx’)
其中,net,P,[S1 , s2 ,…,SN],[TF1,TF2,…,TN1]的意义同上。当网络的训练达到了最大训练次数,或者是网络的误差平方和小于期望最小误差值时,网络就会停止训练。
3.4 对训练好的网络进行检验,判断是否具有良好的泛化功能
把样本输入训练好的网络中,判断输出值是否与已知的样本值相符,如果相符,即说明该网络具有很好的泛化功能,能够应用于预测计算;否则,就要调整网络,或者增大训练的样本数,对网络进行再次训练。该过程可以采用MATLAB中的函数sim ()来实现。sim的表达式为:A =sim ( net , P) ,其中,A为输出数据,P为输入样本数据,其他参数意义同前。该过程还可以用传递函数分步实现。
3.5用训练好的网络进行模拟预测,得到所要的预测值
模拟预测的过程和所采用的函数同2.2.4节,所不同的是输入数据P为要预测的输入数据,输出数据A就是所要得到的预测数据。
function main()
clc % 清屏
clear all; % 清除内存以便加快运算速度
close all; % 关闭当前所有figure图像
warning off; % 屏蔽没有必要的警告
SamNum=20; % 输入样本数量为20
TestSamNum=20; % 测试样本数量也是20
ForcastSamNum=2;% 预测样本数量为2
HiddenUnitNum=8;% 中间层隐节点数量取8
InDim=3; % 网络输入维度为3
OutDim=2; % 网络输出维度为2`
% 原始数据
% 人数
sqrs=[20.55 22.44 25.37 27.13 29.45 30.10 30.96 34.06 36.42 38.09 39.13 39.99 41.93 44.59 47.30 52.89 55.73 56.76 59.17 60.63];
% 机动车数量
sqjdcs=[0.6 0.75 0.85 0.9 1.05 1.35 1.45 1.6 1.7 1.85 2.15 2.2 2.25 2.35 2.5 2.6 2.7 2.85 2.95 3.1];
% 公路面积
sqglmj=[0.09 0.11 0.11 0.14 0.20 0.23 0.23 0.32 0.32 0.34 0.36 0.36 0.38 0.49 0.56 0.59 0.59 0.67 0.69 0.79];
% 公路客运量
glkyl=[5126 6217 7730 9145 10460 11387 12353 15750 18304 19836 21024 19490 20433 22598 25107 33442 36836 40548 42927 43467];
% 公路货运量
glhyl=[1237 1379 1385 1399 1663 1714 1834 4322 8132 8936 11099 11203 10524 11115 13320 16762 18673 20724 20803 21804];
p=[sqrs;sqjdcs;sqglmj]; % 输入数据矩阵
t=[glkyl;glhyl]; % 目标数据矩阵
[SamIn,minp,maxp,tn,mint,maxt]=premnmx(p,t); % 原始样本对(输入和输出)初始化
rand('state',sum(100*clock)); % 依据系统时钟种子产生随机数
NoiseVar=0.01; % 噪声强度为0.01(添加噪声的目的是为了防止网络过度拟合)
Noise=NoiseVar*randn(2,SamNum); % 生成噪声
SamOut=tn+Noise; % 将噪声添加到输出样本上
TestSamIn=SamIn; % 这里取输入样本与测试样本相同,因为样本容量偏少
TestSanOut=SamOut; % 也取输出样本与测试样本相同
MaxEpochs=50000; % 最多训练次数为50000
lr=0.035; % 学习速率为0.035
E0=0.65*10^(-3); % 目标误差为0.65*10^(-3)
W1=0.5*rand(HiddenUnitNum,InDim)-0.1;% 初始化输入层与隐含层之间的权值
B1=0.5*rand(HiddenUnitNum,1)-0.1;% 初始化输入层与隐含层之间的权值
W2=0.5*rand(OutDim,HiddenUnitNum)-0.1;% 初始化输出层与隐含层之间的权值
B2=0.5*rand(OutDim,1)-0.1;% 初始化输出层与隐含层之间的权值
ErrHistory=[]; % 给中间变量预先占据内存
for i=1:MaxEpochs
HiddenOut=logsig(W1*SamIn+repmat(B1,1,SamNum)); % 隐含层网络输出
NetworkOut=W2*HiddenOut+repmat(B2,1,SamNum); %输出层网络输出
Error=SamOut-NetworkOut; % 实际输出与网络输出之差
SSE=sumsqr(Error); % 能量函数(误差平方和)
ErrHistory=[ErrHistory SSE];
if SSE<E0,break,end % 如果达到误差要求则跳出学习循环
% 以下6行是BP网络最核心的程序
% 它们是权值(阙值)依据能量函数负梯度下降原理所做的每一步动态调整
Delta2=Error;
Delta1=W2'*Delta2.*HiddenOut.*(1-HiddenOut);
% 对输出层与隐含层之间的权值和阙值进行修正
dW2=Delta2*HiddenOut';
dB2=Delta2*ones(SamNum,1);
% 对输入层与隐含层之间的权值和阙值进行修正
dW1=Delta1*SamIn';
dB1=Delta1*ones(SamNum,1);
W2=W2+lr*dW2;
B2=B2+lr*dB2;
W1=W1+lr*dW1;
B1=B1+lr*dB1;
end
HiddenOut=logsig(W1*SamIn+repmat(B1,1,TestSamNum)); % 隐含层输出最终结果
NetworkOut=W2*HiddenOut+repmat(B2,1,TestSamNum); % 输出层输出最终结果
a=postmnmx(NetworkOut,mint,maxt); % 还原网络输出层的结果
x=1990:2009; % 时间轴刻度
newk=a(1,:); % 网络输出客运量
newh=a(2,:); % 网络输出货运量
figure;
subplot(2,1,1);plot(x,newk,'r-o',x,glkyl,'b--+'); % 绘制公路客运量对比图
legend('网络输出客运量','实际客运量');
xlabel('年份'); ylabel('客运量/万人');
title('源程序神经网络客运量学习和测试对比图');
subplot(2,1,2);plot(x,newh,'r-o',x,glhyl,'b--+'); % 绘制公路货运量对比图
legend('网络输出货运量','实际货运量');
xlabel('年份'); ylabel('货运量/万人');
title('源程序神经网络货运量学习和测试对比图');
% 利用训练好的数据进行预测
% 当用训练好的网络对新数据pnew进行预测时,也应做相应的处理
pnew=[73.39 75.55
3.9635 4.0975
0.9880 1.0268]; % 2010年和2011年的相关数据
pnewn=tramnmx(pnew,minp,maxp); %利用原始输入数据的归一化参数对新数据进行归一化
HiddenOut=logsig(W1*pnewn+repmat(B1,1,ForcastSamNum)); % 隐含层输出预测结果
anewn=W2*HiddenOut+repmat(B2,1,ForcastSamNum); % 输出层输出预测结果
% 把网络预测得到的数据还原为原始的数量级
format short
anew=postmnmx(anewn,mint,maxt)
BP神经网络的运用极其广泛,并且在很多领域都很实用,BP网络对于非线性的模仿能力很强,这也是它能够广泛运用的重要原因。