「深度学习」深度神经网络DNN

Sternstunden

已于 2024-02-17 16:59:39 修改

阅读量386

点赞数 11

分类专栏：深度学习文章标签： dnn 人工智能神经网络深度学习机器学习

于 2024-01-18 12:49:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52063383/article/details/135671473

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、描述 DNN 的符号

L：层数 (=4)

n^{[l]}：第 l 层的单元数

a^{[l]}：第 l 层的激活 (a^{[l]} = g^{[l]}(z^{[l]}))

w^{[l]} 、b^{[l]}：计算 z^{[l]} 的权重 (z^{[l]} = w^{[l]} a^{[l-1]} +b^{[l]} )

深度学习其实就是多隐层的神经网络。

二、前向和反向传播

1. 前向传播

input: a^{[l-1]}

output: a^{[l]}, cache(z^{[l]})

z^{[l]} = w^{[l]} * a^{[l-1]} + b^{[l]}

a^{[l]} = g^{[l]}(z^{[l]})

2. 反向传播

目的：计算梯度

(1) 算法

input: da^{[l]}

output: da^{[l-1]}, dW^{[l]}, db^{[l]}

dz^{[l]} = da^{[l]} * g^{[l]}\prime(z^{[l]})

dw^{[l]} = dz^{[l]} * a^{[l-1]}

db^{[l]} = dz^{[l]}

da^{[l-1]} = w^{[l]} * dz^{[l]}

总公式： dz^{[l]} = w^{[l+1]} * dz^{[l+1]} * g^{[l]}\prime(z^{[l]})

(2) 激活函数的导数

a. Sigmoid 激活函数

b. tanh 激活函数

g(z) = tanh(z) = \frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}

c. ReLU 激活函数

f(x) =\left\{ \begin{matrix} x, x>=0 \\0, x<0 \end{matrix} \right.

d. Leaky ReLU 激活函数

LeakyReLU(x) = =\left\{ \begin{matrix} x,x>0 \\ \gamma x,x<=0 \end{matrix} \right.

3. 总结

三、搭建深层神经网络

1. 过程

2. 参数 vs 超参数

参数：W^{[1]}, b^{[1]}, W^{[2]}, b^{[2]}, W^{[3]}, b^{[3]} ...
超参数：学习率\alpha, 梯度下降循环次数, 隐藏层数L, 隐藏层单元n^{[1]}, n^{[2]}..., 选择的激活函数，momentum, mini batch, 正则化参数....

超参数最终决定了参数

3. 确认矩阵的维数

检查维数，用于排查 bug

w^{[l]}: (n^{[l]}, n^{[l-1]})

b^{[l]}: (n^{[l]}, 1)

dw^{[l]}: (n^{[l]}, n^{[l-1]})

db^{[l]}: (n^{[l]}, 1)

四、为什么使用深度神经网络？

1. 由浅入深

低层次 (较早的前几层) 可以学习一些简单特征，后几层将这些简单特征结合起来，去探测更复杂的东西。

2. 电路理论

深层比浅层的实现更容易。

3. 和大脑的关系

关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
「深度学习」深度神经网络DNN

「吴恩达」深度学习笔记 - 深度神经网络DNN
复制链接

扫一扫

专栏目录

Sternstunden CSDN认证博客专家 CSDN认证企业博客

码龄4年

24: 原创

118万+: 周排名

8万+: 总排名

2万+: 访问

: 等级

537: 积分

228: 粉丝

301: 获赞

16: 评论

295: 收藏

私信

关注

热门文章

分类专栏

机器学习 8篇
洛谷 1篇
c++ 1篇
深度学习 5篇
函数 1篇
论文 1篇
竞赛 1篇

最新评论

「深度学习」dropout 技术
CSDN-Ada助手: 非常感谢作者分享关于“深度学习”中dropout技术的博客，这个话题对于我们这些对深度学习感兴趣的人来说确实很有帮助。希望作者能够继续分享更多关于深度学习的知识和经验，可以考虑探讨一些深度学习在实际应用中的案例分析，或者是对于未来深度学习发展方向的个人见解。期待作者更多的精彩作品！
「深度学习」门控循环单元GRU
CSDN-Ada助手: 恭喜您写了第18篇博客！标题「深度学习」门控循环单元GRU」非常吸引人。您的博客内容一直都很有深度，我从中学到了很多关于GRU的知识。您对GRU的解释很清晰，让我更好地理解了它在深度学习中的应用。希望您能继续保持创作的热情，分享更多关于深度学习的知识。或许下一步您可以探讨一些GRU的应用案例，或者与其他深度学习模型进行比较，以便我们更全面地了解GRU在实践中的优势和局限性。感谢您的分享，并期待您未来的创作！
「深度学习」长短时记忆网络LSTM
CSDN-Ada助手: 恭喜您写了第19篇博客！标题《「深度学习」长短时记忆网络LSTM》非常有吸引力。您对LSTM的深入探索令人钦佩。如果我可以提供一个谦虚的建议，那就是在下一篇博客中，您可以尝试探讨LSTM在自然语言处理领域的应用，或许可以进一步拓宽读者的视野。期待您持续创作，不断进步！
「深度学习」循环神经网络RNN
CSDN-Ada助手: 非常感谢作者分享关于「深度学习」循环神经网络RNN的博客，内容十分精彩。恭喜您能够持续创作并分享知识，这对读者来说是一大福音。接下来，我希望您可以考虑写一些关于RNN在实际应用中的案例分析，以及对未来深度学习发展的展望，这样可以让读者更好地理解和应用所学的知识。期待您更多的精彩内容！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。