深度学习基础----深度前馈网络

最新推荐文章于 2022-06-30 14:08:20 发布

无意识积累中

最新推荐文章于 2022-06-30 14:08:20 发布

阅读量694

点赞数

分类专栏：深度学习基础

本文链接：https://blog.csdn.net/weiwei935707936/article/details/109502978

版权

45 篇文章 5 订阅

订阅专栏

网络结构

前馈计算:

梯度下降算法		1.初始化参数 2.重复: (1)计算梯度 (2)更新参数
前馈计算		隐层输出
假设J是目标函数, 要求解, 则因链式法则有: , 其中, 则有
定义: 则有:
计算: 输出单元: 隐层单元:
算法整体过程	用公式计算每层的输入a, 和输出z(经激活函数) 计算每层的delta (1)输出层单元: (2)隐层单元: 根据梯度下降算法, 更新权重, 学习规则:

自动微分与计算图 + 动态图和静态图

计算图: 计算好每个节点需要的:
自动微分:	如果函数和参数之间有多条路径, 可以将这多条路径上的导数再进行相加, 得到最终的梯度
静态计算图		在编译时构建计算图, 计算图构建好之后在程序运行时不能改变	静态计算图在构建时可以进行优化, 并行能力强, 但灵活性比较差. 动态计算图不容易优化, 当不同的输入网络结构不一致时, 难以并行计算, 但是灵活性比较高
动态计算图		在程序运行时动态构建