矩阵向量求导链式法则

1. 向量对向量求导的链式法则

       首先我们来看看向量对向量求导的链式法则。假设多个向量存在依赖关系,比如三个向量x→y→z存在依赖关系,则我们有下面的链式求导法则:

       

2. 标量对多个向量的链式求导法则

      在我们的机器学习算法中,最终要优化的一般是一个标量损失函数,因此最后求导的目标是标量,无法使用上一节的链式求导法则,比如2向量,最后到1标量的依赖关系:x→y→z,此时很容易发现维度不相容。

       

    如果是标量对更多的向量求导,比如y1→y2→...→yn→zy1→y2→...→yn→z,则其链式求导表达式可以表示为:

      

3. 标量对多个矩阵的链式求导法则

     下面我们再来看看标量对多个矩阵的链式求导法则,假设有这样的依赖关系:X→Y→z那么我们有:

       

      机器学习常用矩阵求导:

      

 

  • 4
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值