网络结构
|
|
前馈计算:
| |
转存失败重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消转存失败重新上传取消 |
反向传播算法
梯度下降算法 | 1.初始化参数 2.重复: (1)计算梯度 (2)更新参数 | ||
前馈计算 | 隐层输出 | ||
其中, 则有 | |||
则有: | |||
输出单元:
隐层单元: |
| ||
算法整体过程 |
(1)输出层单元: (2)隐层单元:
|
自动微分与计算图 + 动态图和静态图
计算图: 计算好每个节点需要的:
| |||
自动微分:
| 如果函数和参数之间有多条路径, 可以将这多条路径上的导数再进行相加, 得到最终的梯度 | ||
静态计算图 | 在编译时构建计算图, 计算图构建好之后在程序运行时不能改变 | 静态计算图在构建时可以进行优化, 并行能力强, 但灵活性比较差. 动态计算图不容易优化, 当不同的输入网络结构不一致时, 难以并行计算, 但是灵活性比较高 | |
动态计算图 | 在程序运行时动态构建 |