【darknet】源码阅读理解（六）——maxpool的前向传播/反向传播

最新推荐文章于 2022-12-26 18:06:17 发布

农夫山泉2号

最新推荐文章于 2022-12-26 18:06:17 发布

阅读量777

点赞数

分类专栏：深度学习框架

本文链接：https://blog.csdn.net/u011622208/article/details/105167990

版权

深度学习框架专栏收录该内容

20 篇文章 11 订阅

订阅专栏

maxpool是用于数据特征降维，减少CNN网络的计算量，是CNN的基础组件之一。

1. 前向传播

前向传播就是在channel通道上，对一定size*size的正方形区域求出最大值，作为下一层layer的输入。
同时，为了反向误差的传播需要保存最大值所对应的索引index

Code

void forward_maxpool_layer(const maxpool_layer l, network net)
{
    int b,i,j,k,m,n;
    int w_offset = -l.pad/2;
    int h_offset = -l.pad/2;

    int h = l.out_h;        // 输出的尺寸
    int w = l.out_w;
    int c = l.c;

    for(b = 0; b < l.batch; ++b){
        for(k = 0; k < c; ++k){
            for(i = 0; i < h; ++i){
                for(j = 0; j < w; ++j){
                    int out_index = j + w*(i + h*(k + c*b));            // 输出的索引
                    float max = -FLT_MAX;
                    int max_i = -1;
                    for(n = 0; n < l.size; ++n){                        // 一个区域内的最大值
                        for(m = 0; m < l.size; ++m){
                            int cur_h = h_offset + i*l.stride + n;      // 输出的尺寸反推到图像的index
                            int cur_w = w_offset + j*l.stride + m;
                            int index = cur_w + l.w*(cur_h + l.h*(k + b*l.c));  // 卷积核区域的索引
                            int valid = (cur_h >= 0 && cur_h < l.h &&
                                         cur_w >= 0 && cur_w < l.w);
                            float val = (valid != 0) ? net.input[index] : -FLT_MAX;
                            max_i = (val > max) ? index : max_i;        // 最大值的索引
                            max   = (val > max) ? val   : max;          // maxpool的最大值
                        }
                    }
                    l.output[out_index] = max;
                    l.indexes[out_index] = max_i;
                }
            }
        }
    }
}

整个核心就是最内层的两个循环，表示求出ksize*ksize内最大值
外层4个for循环，内层再是两个ksize的for循环
l.indexes是保存到反向传播时需要的

2. 反向传播

Code

void backward_maxpool_layer(const maxpool_layer l, network net)
{
    int i;
    int h = l.out_h;
    int w = l.out_w;
    int c = l.c;
    for(i = 0; i < h*w*c*l.batch; ++i){
        int index = l.indexes[i];
        net.delta[index] += l.delta[i];         // l.delta是误差
    }
}

只有最大值对应的index才有误差

农夫山泉2号

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【darknet】源码阅读理解（六）——maxpool的前向传播/反向传播

maxpool是用于数据特征降维，减少CNN网络的计算量，是CNN的基础组件之一。1. 前向传播前向传播就是在channel通道上，对一定size*size的正方形区域求出最大值，作为下一层layer的输入。同时，为了反向误差的传播需要保存最大值所对应的索引indexCodevoid forward_maxpool_layer(const maxpool_layer l, network...
复制链接

扫一扫

专栏目录