Caffe学习笔记—Caffe反向传播计算

最新推荐文章于 2024-05-10 17:35:25 发布

快乐晓笑98

最新推荐文章于 2024-05-10 17:35:25 发布

阅读量4.3k

点赞数

分类专栏： caffe 文章标签： cnn 预测

本文链接：https://blog.csdn.net/u010987458/article/details/72236864

版权

caffe 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、反向传播的特点
　　CNN进行前向传播阶段点，依次调用每个Layer的Forward函数，得到逐层的输出，最后一层与目标函数比较得到损失函数，计算误差更新值，通过反向传播路径层达到第一层，所有的权值层在反向传播结束后一起更新。
　　这里写图片描述
二、损失函数
　损失层(lossLayer)是CNN的终点，接受两个Blob作为输入，其中一个为CNN的预测值，另一个是真实标签。损失层将这两个输入进行一系列的运算，得到当前网络的损失函数（Loss Function），一般记为L（Θ），其中Θ表示当前网络权值构成的向量空间。机器学习的目的是在权值空间中找到让损失函数L（Θ）最小的权值Θ,可以采取一系列的优化方法（如SGD）逼近权值Θ。
　　Note：损失函数是在前向传播计算中得到的，同时也是反向传播的起点。
　　前向传播：通过网络的输入计算输出结果的过程，在前向传播中，caffe整合每一层的计算得到整个模型的计算函数，这个过程是个自底向上的过程。数据x通过通过内积层得到g(x),然后通过softmax得到h(g(x))和损失函数（softmax loss）fw(x).
　　反向传播网络：根据损失计算梯度，在反向传播过程中，Caffe通过自动求导计算逆向组合每一层的梯度得到整个模型的梯度，在反向传播中，这个过程是自顶向下的。如图：
　　这里写图片描述
　
　三、算法描述
　　　Caffe中实现了多种损失层，分别用于不同的场合。其中SoftmaxWithLossLayer实现了Softmax+交叉熵损失函数计算的过程，适用于单lable 的分类问题；另外欧式损失函数（用于回归问题）、Hinge损失函数（最大间隔分类，SVM）、Sigmoid+交叉熵损失函数（用于多属性，多分类问题）
　

快乐晓笑98

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Caffe学习笔记—Caffe反向传播计算

一、反向传播的特点　　CNN进行前向传播阶段点，依次调用每个Layer的Forward函数，得到逐层的输出，最后一层与目标函数比较得到损失函数，计算误差更新值，通过反向传播路径层达到第一层，所有的权值层在反向传播结束后一起更新。　　二、损失函数　损失层(lossLayer)是CNN的终点，接受两个Blob作为输入，其中一个为CNN的预测值，另一个是真
复制链接

扫一扫