maxpool是用于数据特征降维,减少CNN网络的计算量,是CNN的基础组件之一。
1. 前向传播
前向传播就是在channel通道上,对一定size*size的正方形区域求出最大值,作为下一层layer的输入。
同时,为了反向误差的传播需要保存最大值所对应的索引index
Code
void forward_maxpool_layer(const maxpool_layer l, network net)
{
int b,i,j,k,m,n;
int w_offset = -l.pad/2;
int h_offset = -l.pad/2;
int h = l.out_h; // 输出的尺寸
int w = l.out_w;
int c = l.c;
for(b = 0; b < l.batch; ++b){
for(k = 0; k < c; ++k){
for(i = 0; i < h; ++i){
for(j = 0; j < w; ++j){
int out_index = j + w*(i + h*(k + c*b)); // 输出的索引
float max = -FLT_MAX;
int max_i = -1;
for(n = 0; n < l.size; ++n){ // 一个区域内的最大值
for(m = 0; m < l.size; ++m){
int cur_h = h_offset + i*l.stride + n; // 输出的尺寸反推到图像的index
int cur_w = w_offset + j*l.stride + m;
int index = cur_w + l.w*(cur_h + l.h*(k + b*l.c)); // 卷积核区域的索引
int valid = (cur_h >= 0 && cur_h < l.h &&
cur_w >= 0 && cur_w < l.w);
float val = (valid != 0) ? net.input[index] : -FLT_MAX;
max_i = (val > max) ? index : max_i; // 最大值的索引
max = (val > max) ? val : max; // maxpool的最大值
}
}
l.output[out_index] = max;
l.indexes[out_index] = max_i;
}
}
}
}
}
- 整个核心就是最内层的两个循环,表示求出ksize*ksize内最大值
- 外层4个for循环,内层再是两个ksize的for循环
- l.indexes是保存到反向传播时需要的
2. 反向传播
Code
void backward_maxpool_layer(const maxpool_layer l, network net)
{
int i;
int h = l.out_h;
int w = l.out_w;
int c = l.c;
for(i = 0; i < h*w*c*l.batch; ++i){
int index = l.indexes[i];
net.delta[index] += l.delta[i]; // l.delta是误差
}
}
- 只有最大值对应的index才有误差