cs231n - assignment1 - neural net 梯度推导

最新推荐文章于 2024-07-13 11:10:11 发布

蜗牛一步一步往上爬

最新推荐文章于 2024-07-13 11:10:11 发布

阅读量8.6k

点赞数 8

分类专栏： machine learning 文章标签： cs231n

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yc461515457/article/details/51944683

版权

这篇博客介绍了使用神经网络进行CIFAR-10数据集分类的过程，强调了矩阵形式的梯度推导和逐级反向传播。内容涵盖了网络结构、训练过程、超参数调优的影响，以及通过调整学习率、正则化强度等参数提高验证准确率的实践。

摘要由CSDN通过智能技术生成

Implementing a Neural Network

In this exercise we will develop a neural network with fully-connected layers to perform classification, and test it out on the CIFAR-10 dataset.

可以先看看之前softmax的梯度推导方法，这里开始采用矩阵的形式来推导梯度，而且将逐级推导梯度，这种方式有很大的好处。
首先来回顾一下我们的网络结结构：输入层（D），全连接层-ReLu(H)，softmax(C)。网络输入 $X_{[N \times D]}$ ，groundtruth $y_{[N \times 1]}$
网络参数： $W_1{_{ [D \times H] }}, b_1{_{[1 \times H]}}, W_2{_{ [H \times C]}}, b_2{_{[1 \times C] }}$

Propagation:

F C 1_o u t = X \cdot W 1 + b 1 - - - (1)

$FC1\_out = X \cdot W_1+b_1 ---(1)$

H_o u t = m a x i m u m (0, F C 1_o u t) - - - (2)

$H\_out = maximum(0, FC1\_out)---(2)$

F C 2_o u t = H_o u t \cdot W 2 + b 2 - - - (3)

$FC2\_out = H\_out \cdot W_2+b_2---(3)$

最低0.47元/天解锁文章

蜗牛一步一步往上爬

关注

8
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。