神经网络的反向传播求梯度

我的学习笔记.参考:https://www.cnblogs.com/sumwailiu/p/13610588.html

1. 数学基础:参考:https://www.cnblogs.com/sumwailiu/p/13398121.html

2.tensorflow中有求梯度的函数直接调用。可以自行验证。

3.代码:

import pandas as pd
import numpy as np
import tensorflow as tf
np.random.seed(0)  

def crossentropy(y_pred,y_true):
    return -tf.reduce_sum(y_true*tf.math.log(y_pred)) 

with tf.GradientTape(persistent=True) as t:
    #---------input----------
    x = tf.constant(np.random.randn(1, 9, 9, 1).astype(np.float32))
    y_true = np.array([0.3,0.5,0.2]).astype(np.float32)
    t.watch(x)                                #例子中的watch函数把需要计算梯度的变量x加进来了
    
    #-----------conv l1---------------
    l1 = tf.keras.layers.Conv2D(filters=1,kernel_size=(3,3),strides=2)
    z_l1 = l1(x)
    t.watch(z_l1)
    a_l1 = tf.nn.relu(z_l1)
    t.watch(a_l1)
    
    #---------max pooling l2----------
    l2 =  tf.keras.layers.MaxPool2D(pool_size=(2,2))
    z_l2 = l2(a_l1)
    t.watch(z_l2)
    a_l2 = tf.keras.layers.Flatten()(z_l2) #3维转换成一维
    t.watch(a_l2)
    
    #--------------FNN L3----------------
    l3 = tf.keras.layers.Dense(3)
    z_l3 = l3(a_l2)
    t.watch(z_l3)
    a_l3 = tf.math.softmax(z_l3)
    t.watch(a_l3)
    
    #--------------loss----------------
    loss = crossentropy(y_pred = a_l3,y_true = y_true)

print(z_l1)

print(l1.kernel.numpy())

print(a_l1)

print(np.squeeze(t.gradient(loss, l1.kernel)))  

print(np.squeeze(t.gradient(loss, z_l1)))  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值