神经网络计算过程(正向传播,反向传播,优化策略和参数更新)

4 篇文章 0 订阅
3 篇文章 0 订阅

神经网络计算过程

原理是设计一个多参数的非线性组合模型,即多层神经网络model.
用这个model来近似(拟合)一个无法求出的复杂函数 y = f(x).
(输入x和输出y皆为高维变量的)

  • 定义这个模型的前向传播过程,即forward : 即数据input进model,model输出output,类似y=f(x).

  • 根据Loss的定义,一般为真实样本的(y,x),和模型的随机输入和输出 (z,y’)的比较函数。在Loss中分别对每个维度的参数求其偏导数,得到每个参数的偏导数值即x_i.grad()

  • 根据优化(Optimizer)的学习策略,小幅更新各个参数的梯度. 先看其grad正负,再根据正负方向对原参数值加减一定比例的梯度值

(更新公式:w = w - n*grad, 如果梯度值为正,原参数就会减小。如果梯度值为负,原参数值就会增大)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值