李宏毅深度学习Task04

最新推荐文章于 2024-10-04 20:50:17 发布

weixin_44145055

最新推荐文章于 2024-10-04 20:50:17 发布

阅读量139

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44145055/article/details/118885295

版权

本文概述了深度学习的基本步骤，包括神经网络的设计（完全连接前馈网络，自定义隐藏层）、模型评估（交叉熵Loss函数）和最优函数选择（梯度下降与反向传播）。重点介绍了反向传播算法在大规模参数更新中的高效计算方法。

摘要由CSDN通过智能技术生成

1.深度学习简介

三个步骤：神经网络设计；模型好坏评估；最优函数选择

a. 神经网络设计

神经网络：完全连接前馈神经网络

完全？因为相邻两层之间的每个单元彼此之间都互相关联

前馈？信号流动是单向的，都是从输入到输出

深度？整个网络中隐藏层的层数是不定的，可以很多层，当然计算量也会增大，精度会提高

隐藏层？中间层数和结构可以自行设计

b. 模型评估

不同于前面机器学习模型，使用交叉熵定义Loss function

c. 选择最优函数

使用梯度下降选择最优函数；后面介绍使用反向传播来进行计算

2. 反向传播

反向传播是一种针对梯度下降的算法，可以更有效率的计算梯度下降，尤其是在深度学习中，具有百万参数的情况下

总体损失函数：基于整个训练集

一个神经元的偏微分是包括forward pass和backward pass

forward pass容易计算，就是连接层的输入，可以直接计算得到

backward pass是利用反向链式法则计算，通过从后到前的方式计算偏微分

然后将两者进行乘积运算，可以得到loss对参数的偏微分，然后利用梯度下降进行更新，获取最优函数即可。

weixin_44145055

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。