矩阵求导基础

本文介绍了矩阵导数的基础概念,重点讲解了矩阵的迹及其性质,包括迹的交换律、转置不变性等。此外,探讨了矩阵求导的若干重要公式,如∇AtrAB=BT,并应用这些公式推导出∇A|A|=|A|(A^(-1))^T。最后,提及了机器学习中与梯度下降相关的矩阵求导问题。
摘要由CSDN通过智能技术生成

[1] 矩阵导数定义

需要用到矩阵的一些求导技术,假设对于一个大小为 m×n m × n 的矩阵 A A ,我们存在这样的一个映射 f f:Rm×nR f : R m × n → R ,即他可以吧矩阵A映射到一个实数),接下来我们定义 f f 对矩阵 A 的导数如下:

Af(A)=fA11fAn1fA1nfAnn ∇ A f ( A ) = [ ∂ f ∂ A 11 ⋯ ∂ f ∂ A 1 n ⋮ ⋱ ⋮ ∂ f ∂ A n 1 ⋯ ∂ f ∂ A n n ]

而一般来说, f(A) f ( A ) 会定义为矩阵的迹(因为我们可以使用迹的技巧对矩阵进行各种方便的求导)。

[2] 矩阵的迹

对于一个n阶方阵A的迹被定义为方阵A的主对角线的元素之和,通常对方阵的求迹操作写成 trA t r A ,于是我们有

trA=i=1nAii t r A = ∑ i = 1 n A i i

开篇论文中写到的 trace t r a c e 就是对矩阵求迹的意思,接下来介绍下关于迹的一些比较有用的性质:

1trABC=trBCA=trCBA 1 ) t r A B C = t r B C A = t r C B A

也就是对多个矩阵的相乘求迹时,矩阵的顺序是可以调换的(注意有个循环的顺序在里面),这个性质很有用可以结合后面的公式方便地对矩阵进行求导。

2trA=tr

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值