头歌——机器、深度学习——卷积层和池化层的反向传播的实现

国王学会了编程

已于 2024-06-15 21:38:25 修改

阅读量710

点赞数 8

分类专栏：深度学习头歌机器学习文章标签：深度学习人工智能机器学习 python

于 2024-06-15 21:36:42 首次发布

本文链接：https://blog.csdn.net/absths/article/details/139708990

版权

机器学习同时被 3 个专栏收录

18 篇文章 1 订阅

订阅专栏

头歌

17 篇文章 0 订阅

订阅专栏

深度学习

11 篇文章 0 订阅

订阅专栏

卷积层和池化层的反向传播的实现

第1关：实现卷积层的反向传播

任务描述

本关任务：实现卷积层的反向传播。

编程要求

根据提示，在右侧编辑器 Begin 和 End 之间补充代码，实现上述卷积层的前向传播。

测试说明

平台会对你编写的代码进行测试，测试方法为：平台会随机产生输入x、权重W、偏置b和输出梯度dout，然后根据你的实现代码，创建一个Convolution类的实例，然后利用该实例先进行前向传播计算，再进行反向传播计算。你的答案将并与标准答案进行比较。因为浮点数的计算可能会有误差，因此只要你的答案与标准答案之间的误差不超过10−5即可。

上述结果有四舍五入的误差，你可以忽略。

样本输入样例：略

开始你的任务吧，祝你成功！

第1关任务代码

import numpy as np
from utils import im2col, col2im
 
 
class Convolution:
    def __init__(self, W, b, stride=1, pad=0):
        r'''
        卷积层的初始化
        Parameter:
        - W: numpy.array, (C_out, C_in, K_h, K_w)
        - b: numpy.array, (C_out)
        - stride: int
        - pad: int
        '''
        self.W = W
        self.b = b
        self.stride = stride
        self.pad = pad
        self.x = None
        self.col = None
        self.col_W = None
        self.dW = None
        self.db = None
 
    def forward(self, x):
        r'''
        卷积层的前向传播
        Parameter:
        - x: numpy.array, (B, C, H, W)
        Return:
        - y: numpy.array, (B, C', H', W')
             H' = (H - Kh + 2P) / S + 1
             W' = (W - Kw + 2P) / S + 1
        '''
        FN, C, FH, FW = self.W.shape
        N, C, H, W = x.shape
        out_h = 1 + int((H + 2 * self.pad - FH) / self.stride)
        out_w = 1 + int((W + 2 * self.pad - FW) / self.stride)
        col = im2col(x, FH, FW, self.stride, self.pad)
        col_W = self.W.reshape(FN, -1).T
        out = np.dot(col, col_W) + self.b
        out = out.reshape(N, out_h, out_w, -1).transpose(0, 3, 1, 2)
        self.x = x
        self.col = col
        self.col_W = col_W
 
        return out
 
    def backward(self, dout):
        r'''
        卷积层的反向传播
        Parameter:
        - dout: numpy.array, (B, C', H', W')
        Return:
        - dx: numpy.array, (B, C, H, W)
        另外，还需计算以下结果：
        - self.dW: numpy.array, (C', C, Kh, Kw) 与self.W形状相同
        - self.db: numpy.array, (C',) 与self.b形状相同
        '''
        ########## Begin ##########
        FN, C, FH, FW = self.W.shape
        dout = dout.transpose(0, 2, 3, 1).reshape(-1, FN)
        self.db = np.sum(dout, axis=0)
        self.dW = np.dot(self.col.T, dout)
        self.dW = self.dW.transpose(1, 0).reshape(FN, C, FH, FW)
        dcol = np.dot(dout, self.col_W.T)
        dx = col2im(dcol, self.x.shape, FH, FW, self.stride, self.pad)
        return dx
        ########## End ##########

第2关：实现池化层的反向传播

任务描述

本关任务：实现池化层的反向传播。

编程要求

根据提示，在右侧编辑器 Begin 和 End 之间补充代码，实现上述池化层的反向传播。

测试说明

平台会对你编写的代码进行测试，测试方法为：平台会随机产生输入x和输出梯度dout，然后根据你的实现代码，创建一个MaxPool类的实例，然后利用该实例先进行前向传播计算，再进行反向传播计算。你的答案将并与标准答案进行比较。因为浮点数的计算可能会有误差，因此只要你的答案与标准答案之间的误差不超过10−5即可。

样例输入：略

开始你的任务吧，祝你成功！

第2关任务代码

import numpy as np
from utils import im2col, col2im
 
 
class MaxPool:
    def __init__(self, pool_h, pool_w, stride=1, pad=0):
        r'''
        池化层的初始化
        Parameter:
        - pool_h: int
        - pool_h: int
        - stride: int
        - pad: int
        '''
        self.pool_h = pool_h
        self.pool_w = pool_w
        self.stride = stride
        self.pad = pad
        self.x = None
        self.arg_max = None
 
    def forward(self, x):
        r'''
        池化层的前向传播
        Parameter:
        - x: numpy.array, (B, C, H, W)
        Return:
        - y: numpy.array, (B, C, H', W')
             H' = (H - Kh + 2P) / S + 1
             W' = (W - Kw + 2P) / S + 1
        '''
        N, C, H, W = x.shape
        out_h = int(1 + (H - self.pool_h + 2 * self.pad) / self.stride)
        out_w = int(1 + (W - self.pool_w + 2 * self.pad) / self.stride)
        col = im2col(x, self.pool_h, self.pool_w, self.stride, self.pad)
        col = col.reshape(-1, self.pool_h * self.pool_w)
        arg_max = np.argmax(col, axis=1)
        out = np.max(col, axis=1)
        out = out.reshape(N, out_h, out_w, C).transpose(0, 3, 1, 2)
        self.x = x
        self.arg_max = arg_max
        return out
 
    def backward(self, dout):
        r'''
        池化层的反向传播
        Parameter:
        - dout: numpy.array, (B, C', H', W')
        Return:
        - dx: numpy.array, (B, C, H, W)
        '''
        ########## Begin ##########
        dout = dout.transpose(0, 2, 3, 1)
        pool_size = self.pool_h * self.pool_w
        dmax = np.zeros((dout.size, pool_size))
        dmax[np.arange(self.arg_max.size), self.arg_max.flatten()] = dout.flatten()
        dmax = dmax.reshape(dout.shape +(pool_size,))
        dcol = dmax.reshape(dmax.shape[0] *dmax.shape[1] * dmax.shape[2],-1)
        dx = col2im(dcol, self.x.shape, self.pool_h, self.pool_w, self.stride , self.pad)
        return dx
        ########## End ##########