Python神经网络代码实现流程(三)：反向传播与梯度下降

最新推荐文章于 2024-07-08 20:52:26 发布

H-T-TYSK

最新推荐文章于 2024-07-08 20:52:26 发布

阅读量2.2k

点赞数

分类专栏：编程人工智能算法神经网络文章标签： python 神经网络手写字识别

本文链接：https://blog.csdn.net/yuyushikuan/article/details/78456424

版权

本文详细介绍了Python中神经网络的反向传播和梯度下降算法，这是训练神经网络的关键过程。内容包括梯度下降的算法实现以及反向传播的代码示例，特别关注在手写字识别任务中的应用。

摘要由CSDN通过智能技术生成

前向传播为输入的矩阵经过计算到输出层，而反向传播与梯度下降则是训练神经网络的核心步骤．
梯度下降算法的代码如下：

def SGD(self, training_data, epochs, mini_batch_size, eta, test_data = None):  
    if test_data: n_test = len(test_data)  
    n = len(training_data)  
    for j in range(epochs):  　#自动定义的循环次数，也就是训练神经网络的循环次数
        random.shuffle(training_data)  #shuffle为将训练接随机打乱重排，保证训练的数据的随机性
        mini_batches = [training_data[k:k+mini_batch_size] for k in range(0, n, mini_batch_size)]  　#这里形成了一个列表，列表的每一个元素为一个矩阵，一个矩阵就是一次循环的小型数据集．更新神经网络的时候，利用的并不是一个数据（一张图片），而是利用的一个小型矩阵．这样的向量化处理大大提高了代码的执行效率．
        for mini_batch in mini_batches:  
            self.update_mini_batch(mini_batch, eta)  #这里就是利用小型的矩阵对神经网络的所有参数进行一次全面的更新（下面的代码会详细讲解）
        if test_