- 矩阵Y对标量x求导:
Y = [ y(ij) ]
dY / dx = [ dy(ji) / dx ]
求导后,Y变转置了。
- 标量y对矩阵X求导:
dy / dX = [ Dy/Dx(ij) ]
求导后,不需要转置。
//重要结论
y = U'XV = ΣΣu(i)x(ij)v(j)于是 dy/dX = [u(i)v(j)] = UV'
y = U'X'XU 则 dy/dX =2XUU'
y = (XU-V)'(XU-V) 则 dy/dX =d(U'X'XU - 2V'XU + V'V)/dX = 2XUU' - 2VU' + 0 = 2(XU-V)U'
- 标量y对列向量X求导:
y = f(x1, x2, ..., xn)
dy / dX = [ Dy / Dx(1), Dy / Dx(2), ..., Dy / Dx(n) ] <列向量>
求导后,还是列向量
- 行向量Y对列向量X求导:
1M 向量对 N1 向量求导为 N*M 矩阵
// 重要结论
dX <行向量> / dX <列向量> = I <单位阵>
d(AX) <列向量> / dX <行向量> = A <T>
- 列向量Y对