【CS224n-4】Matrix Calculus and Backpropagation

用一个三层神经网络计算一个窗口的得分

维度分析:如果我们使用 4 维的词向量来表示每个单词并使用 5 个词的窗口,则输入是 x∈R^{20} 。如果我们在隐藏层使用 8 个 sigmoid 单元和从激活函数中生成一个分数输出,其中 W∈R^{8*20} , b∈R^{8}, U∈R^{8*1}, s∈R 。

使用SGD更新参数:

上节课有提到,在更新参数是时计算 ∇θJ(θ)的方法

  • 手工计算
  • 算法:反向传播

1.手工推导

   1.1 导数链

    对于单变量函数:乘以导数

  对于一次处理多个变量:乘以雅可比矩阵

由于使用的是 element-wise,所以 hi=f(zi)

        函数有n个输出和n个输入 → n×n 的雅可比矩阵

1.2 推导

  • 把方程分解成简单的片段

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值