深度学习入门(基于python实现)--第七章卷积神经网络 02

最新推荐文章于 2022-12-29 09:33:06 发布

zyhsna

最新推荐文章于 2022-12-29 09:33:06 发布

阅读量224

点赞数

分类专栏：深度学习文章标签：神经网络深度学习卷积神经网络

本文链接：https://blog.csdn.net/zyhsna/article/details/108527429

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

# _*_ coding:UTF-8 _*_
# 文件名：Convolutional_neural_network_02.py
# 开发工具：PyCharm
"""
将前面的所有组装在一起，搭建一个CNN神经网络
"""
import pickle
import numpy as np
from collections import OrderedDict
from common.layers import *


class SimpleConvNet:
    """简单的CNN网络
    Parameters
    ----------
    conv_param : 卷积层的超参数(type：dict)
        filter_num : 滤波器数量
        filter_size : 滤波器大小
        stride : 步幅
        pad : 填充

    input_size : 输入数据的维度
    hidden_size_list : 隐藏层的神经元数目
    output_size : 输出层神经元数目
    activation : 激活函数'relu' or 'sigmoid'
    weight_init_std : 权值初始的标准差
    """

    def __init__(self, input_dim=(1, 28, 28),
                 conv_param={'filter_num': 30, 'filter_size': 5, 'pad': 0, 'stride': 1},
                 hidden_size=100, output_size=10, weight_init_std=0.01):
        filter_num = conv_param['filter_num']
        filter_size = conv_param['filter_size']
        filter_pad = conv_param['pad']
        filter_stride = conv_param['stride']
        input_size = input_dim[1]
        conv_output_size = (input_size - filter_size + 2 * filter_pad) / filter_stride + 1
        pool_output_size = int(filter_num * (conv_output_size / 2) * (conv_output_size / 2))

        # 权重初始化
        self.params = {}
        self.params['W1'] = weight_init_std * \
                            np.random.randn(filter_num, input_dim[0], filter_size, filter_size)
        self.params['b1'] = np.zeros(filter_num)
        self.params['W2'] = weight_init_std * \
                            np.random.randn(pool_output_size, hidden_size)
        self.params['b2'] = np.zeros(hidden_size)
        self.params['W3'] = weight_init_std * \
                            np.random.randn(hidden_size, output_size)
        self.params['b3'] = np.zeros(output_size)

        # 生成必要的层
        self.layers = OrderedDict()
        self.layers['Conv1'] = Convolution(self.params['W1'], self.params['b1'],
                                           conv_param['stride'], conv_param['pad'])
        self.layers['Relu1'] = Relu()
        self.layers['Pool1'] = Pooling(pool_h=2, pool_w=2, stride=2)
        self.layers['Affine1'] = Affine(self.params['W2'], self.params['b2'])
        self.layers['Relu2'] = Relu()
        self.layers['Affine2'] = Affine(self.params['W3'], self.params['b3'])

        self.last_layer = SoftmaxWithLoss()

    def predict(self, x):
        for layer in self.layers.values():
            x = layer.forward(x)

        return x

    def loss(self, x, t):
        """
        损失函数
        """
        y = self.predict(x)
        return self.last_layer.forward(y, t)

    def gradient(self, x, t):
        # forward
        self.loss(x, t)

        # backward
        dout = 1
        dout = self.last_layer.backward(dout)

        layers = list(self.layers.values())
        layers.reverse()
        for layer in layers:
            dout = layer.backward(dout)

        # 設定
        grads = {}
        grads['W1'], grads['b1'] = self.layers['Conv1'].dW, self.layers['Conv1'].db
        grads['W2'], grads['b2'] = self.layers['Affine1'].dW, self.layers['Affine1'].db
        grads['W3'], grads['b3'] = self.layers['Affine2'].dW, self.layers['Affine2'].db

        return grads

到此《深度学习入门-基于python的理论和实现》一书代码全部完结

zyhsna

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习入门(基于python实现)--第七章卷积神经网络 02

# _*_ coding:UTF-8 _*_# 文件名：Convolutional_neural_network_02.py# 开发工具：PyCharm"""将前面的所有组装在一起，搭建一个CNN神经网络"""import pickleimport numpy as npfrom collections import OrderedDictfrom common.layers import *class SimpleConvNet: """简单的CNN网络 Param
复制链接

扫一扫