神经网络的学习(Neural Networks: Learning)-反向传播算法

最新推荐文章于 2024-03-07 13:42:18 发布

hi,world

最新推荐文章于 2024-03-07 13:42:18 发布

阅读量416

点赞数 1

分类专栏：机器学习文章标签：神经网络 BP算法

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

梯度下降算法中每一次迭代都按照如下公式进行更新：

a是学习速率。其中关键步骤是计算偏导数，为了计算代价函数的偏导数，我们需要采用一种反向传播算法：

（1）进行前向传播计算

（2）计算输出层的总误差

（3）反向传播计算各层误差

（4）计算最终的偏导数值

假设只有一个实例的四层神经网络如下：

（1）进行前向传播计算：

（z是没经过激活函数的输出，a是经过激活函数的输出）

（2）由于单个神经元采用逻辑回归模型，因此定义误差为：

则最后一层的误差：

（若是线性回归，可直接得出）

（3）根据链式求导法则，反向传播计算各层误差：

（4）根据链式求导法则，计算最终的偏导数值：

相关代码实现：

%1.先前向传播计算代价函数
X1=[ones(m,1),X];%5000*401,X为输入的训练数据
a2 =sigmoid(X1 * Theta1');  % 第二层激活函数输出，5000*401/401*25
a2 = [ones(m, 1) a2];       % 第二层加入b，5000*26
a3 = 1 ./ ( 1 + exp(-a2 * Theta2') ) ;%第三层输出（即输出层）
J1=0;
for i=1:num_labels
    y1=(y==i);
    %针对每个分类进行计算
    J1=sum(y1 .* log( a3(:,i)) + (1 - y1 ) .* log( (1 - a3(:,i)) ))+J1;
end
%对代价函数进行正则化
temp1 = [zeros(size(Theta1,1),1) Theta1(:,2:end)];   % 先把theta(1)拿掉，不参与正则化
temp2 = [zeros(size(Theta2,1),1) Theta2(:,2:end)];
temp1 = sum(temp1 .^2);     % 计算每个参数的平方，再就求和
temp2 = sum(temp2 .^2);
J= -1 /m*J1+lambda/(2*m) * ( sum(temp1(:))+ sum(temp2(:)) );

%2.后向传播算法计算偏导数
delta_1 = zeros(size(Theta1));
delta_2 = zeros(size(Theta2));
%2.1.前向传播计算输出（a3）
%2.2.计算总误差
err3=zeros(size(a3));%5000*10
for i=1:num_labels
    err3(:,i)=a3(:,i)-(y==i);
end
%2.3.后向传播计算各层误差（由上一层误差和权值决定）
err2=Theta2'*err3';%26*10/10*5000
err2=err2(2:end,:).*((a2(:,2:end))'.*(1-a2(:,2:end))');%25*5000/25*5000
%2.4.计算偏导数
for i=1:m
    delta_1 = delta_1+err2(:,i)*X1(i,:);%25*1/1*401
    delta_2 = delta_2 + (err3(i,:))'* a2(i,:);%10*1/1*26
end
%2.5.加入正则化项
temp1 = [zeros(size(Theta1,1),1) Theta1(:,2:end)];   % 先把theta(1)拿掉，不参与正则化
temp2 = [zeros(size(Theta2,1),1) Theta2(:,2:end)];
Theta1_grad=1/m*delta_1+lambda/m*temp1;
Theta2_grad=1/m*delta_2+lambda/m*temp2;
%将参数从矩阵展开成向量,得到最终计算出的偏导数
grad = [Theta1_grad(:) ; Theta2_grad(:)];

----来源于斯坦福公开课

hi,world

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络的学习(Neural Networks: Learning)-反向传播算法

本文进行了神经网络中的反向传播算法的公式推导，并给出了相关代码实现，代码来源于斯坦福公开课加以修改，主要实现了神经网络中的代价函数计算及BP算法的计算。
复制链接

扫一扫