cs231n assignment1 Q4 softmax梯度推导

本文详细推导了斯坦福cs231n课程2017年版assignment1的第四题,涉及网络结构为输入-全连接层-ReLU-全连接层-softmax。针对每个训练样本,定义并计算了损失函数,然后推导了从softmax层到第二全连接层权重W2的梯度。
摘要由CSDN通过智能技术生成

本文推导了斯坦福课程cs231n(2017)assignment1 Q4的反向传播梯度

网络结构为
输入–全连接层–ReLU–全连接层–softmax
XH=XW1+b1R=max(0,H)F=RW2+b2softmax X − H = X W 1 + b 1 − R = max ( 0 , H ) − F = R W 2 + b 2 − softmax
其中, X X 为输入,每一行表示一个样本, W 1 W 2 分别为第一和第二连接层的权重, b1b2 b 1 , b 2 分别为第一和第二连接层的偏置。 F F 为第二连接层的输出(score)。
首先定义损失函数,对于每个训练样本,损失函数定义如下

L i = log ( e F i , y i j e F i , j ) .

总的损失函数为所有样本损失函数的均值加上正则项

L=1NiLi+λ(klW21kl+klW22kl). L = 1 N ∑ i L i + λ ( ∑ k ∑ l W 1 k l 2 + ∑ k ∑ l W 2 k l 2 ) .


pi,k=eFi,k
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值