计算图与自动微分优化问题

最新推荐文章于 2024-05-10 23:07:11 发布

生命苦短必须喜感

最新推荐文章于 2024-05-10 23:07:11 发布

阅读量186

点赞数

文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45051096/article/details/127603094

版权

计算图与自动微分

构造模型： model=Sequential()
全连接层：Dense()
输入输出维度：output_dim,input_dim
激活函数(使用的relu)：Activation(“relu”)
损失函数(使用的交叉熵)：loss=‘categorical_crossentropy’
优化(使用梯度下降法)：optimizer=‘sgd’
衡量指标(使用的准确率)：metrics=[‘accuracy’]
随机梯度下降开始训练：model.fit()

深度学习的三个步骤

1.定义网络
2.损失函数
3.优化

前馈神经网络的训练过程

1.前向计算每一层的状态和激活值，直到最后一层(损失函数)
2.反向计算每一层的参数的偏导数(梯度)
3.更新参数

计算图

当我们设计软件去实现神经网络的时候，我们希望有一个方法，不管网络结构是什么类型的，我们都可以无缝衔接地去计算梯度。所以，当网络发生变化的时候，程序员不需要去手动计算梯度，只需要通过软件来实现。我们用计算图的数据结构来实现这个想法。

优化问题

难点
非凸优化问题：即存在局部最优而非全局最优解，影响迭代
梯度消失问题：下层参数比较难调
参数过多，影响训练，参数解释起来比较困难
需求
计算资源要大
数据要多
算法效率要好，即收敛快

生命苦短必须喜感

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算图与自动微分优化问题

计算图自动微分
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。