神经网络的反向传播求梯度

最新推荐文章于 2022-10-18 13:47:16 发布

都到齐了吗

最新推荐文章于 2022-10-18 13:47:16 发布

阅读量130

点赞数

文章标签： tensorflow 深度学习 pytorch 神经网络

原文链接：https://www.cnblogs.com/sumwailiu/p/13610588.html

版权

这篇博客介绍了如何在TensorFlow中进行梯度计算，并通过一个示例展示了从输入到损失函数的整个流程，包括卷积层、ReLU激活函数、最大池化层以及全连接层的使用。最后，博主演示了如何计算损失函数相对于权重的梯度。

摘要由CSDN通过智能技术生成

我的学习笔记.参考：https://www.cnblogs.com/sumwailiu/p/13610588.html

1. 数学基础：参考：https://www.cnblogs.com/sumwailiu/p/13398121.html

2.tensorflow中有求梯度的函数直接调用。可以自行验证。

3.代码：

import pandas as pd
import numpy as np
import tensorflow as tf
np.random.seed(0)

def crossentropy(y_pred,y_true):
return -tf.reduce_sum(y_true*tf.math.log(y_pred))

with tf.GradientTape(persistent=True) as t:
#---------input----------
x = tf.constant(np.random.randn(1, 9, 9, 1).astype(np.float32))
y_true = np.array([0.3,0.5,0.2]).astype(np.float32)
t.watch(x) #例子中的watch函数把需要计算梯度的变量x加进来了

#-----------conv l1---------------
l1 = tf.keras.layers.Conv2D(filters=1,kernel_size=(3,3),strides=2)
z_l1 = l1(x)
t.watch(z_l1)
a_l1 = tf.nn.relu(z_l1)
t.watch(a_l1)

#---------max pooling l2----------
l2 = tf.keras.layers.MaxPool2D(pool_size=(2,2))
z_l2 = l2(a_l1)
t.watch(z_l2)
a_l2 = tf.keras.layers.Flatten()(z_l2) #3维转换成一维
t.watch(a_l2)

#--------------FNN L3----------------
l3 = tf.keras.layers.Dense(3)
z_l3 = l3(a_l2)
t.watch(z_l3)
a_l3 = tf.math.softmax(z_l3)
t.watch(a_l3)

#--------------loss----------------
loss = crossentropy(y_pred = a_l3,y_true = y_true)