这几天需要自己写个loss层,因此把caffe源码研读了下,在此记录下经验,方便后人以及自己日后复习。
首先看看caffe前向传播的工作流程,即net.cpp中的ForwardFromTo函数:
可以看到,该函数通过一个for循环来对每一个layer执行前向传播传播。具体的传播函数在layer.hpp中可以找到:
可以看到在这个函数中,最主要的就是执行了Reshape和Forward_cpu函数,剩下的就是对数据的一些处理,我们暂时先不用管它。然后由于Reshape和Forward_cpu都是虚函数,都是由具体的子类来实现的,即softmax_loss_layer.cpp中。接下来我们仔细看看softmax_loss_layer.cpp:
namespace caffe { template <typename Dtype> void SoftmaxWithLossLayer<Dtype>::LayerSetUp( const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) { LossLayer<Dtype>::LayerSetUp(bottom, top);
LayerParameter softmax_param(this->layer_param_); softmax_param.set_type("Softmax");
//softmax loss涉及到两层计算,第一层是通过softmax函数计算出每一个分类的概率,第二层
//则是通过概率计算出最终的损失,在caffe中是将这两步操作分开在了两层中,分别是softmax_layer
//和softmax_loss_l