第十八周周三报告

天下第一猛男l

已于 2022-06-29 22:27:00 修改

阅读量65

点赞数

文章标签：其他

于 2021-09-06 22:58:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16600319/article/details/120145654

版权

目录

一.ML为什么需要矩阵求导
- 1.原因
- 2.优点
二.向量函数与矩阵函数初印象
三.求导秘术：YX拉伸
四.常见的矩阵求导
五.矩阵求导细节补充
六.最小二乘法

一.ML为什么需要矩阵求导

1.原因

vectorization
求导在优化算法中的广泛应用

2.优点

简介
加速计算机运行

二.向量函数与矩阵函数初印象

1.标量函数

标量函数：输出为标量的函数
例如:
- $f(x)=x^2$ , $\mathbf{R} \rightarrow \mathbf{R}:x \rightarrow x^2$
- $f(x)=x_1^2+x_2^2,\mathbf{R}^2 \rightarrow \mathbf{R}:$ $\begin{bmatrix} x_1 \\ x_2 \end{bmatrix} \rightarrow x_1^2+x_2^2$

2.向量函数

向量函数：输出为向量(矩阵)的函数
例如：
- $f(x)=\begin{bmatrix} f_1(x)=x \\ f_2(x)=x^2\end{bmatrix},\mathbf{R} \rightarrow \mathbf{R}^2:x \rightarrow \begin{bmatrix} x \\ x^2\end{bmatrix}$
- $f(x)=\begin{bmatrix} f_1(x)=x&f_2(x)=x^2\\ f_3(x)=x^3 &f_4(x)=x^4\end{bmatrix},\mathbf{R} \rightarrow \mathbf{R}^{2\times2}:x \rightarrow \begin{bmatrix} x &x^2\\x^3&x^4\end{bmatrix}$
- $f(x)=\begin{bmatrix} f_1(x)=x_1+x_2&f_2(x)=x_1^2+x_2^2\\ f_3(x)=x_1^3 +x_2^3&f_4(x)=x_1^4+x_2^4\end{bmatrix},\mathbf{R}^2 \rightarrow \mathbf{R}^{2\times2}: \begin{bmatrix} x_1 \\ x_2\end{bmatrix}\rightarrow \begin{bmatrix} x_1+x_2 &x_1^2+x_2^2\\x_1^3 +x_2^3&x_1^4+x_2^4\end{bmatrix}$
总结： $x$ :可以为标量，向量，矩阵； $f (x)$ :可以为标量，向量，矩阵

3.矩阵求导的本质

$\frac{\mathrm{d}\mathbf{A}}{\mathrm{d}\mathbf{B}}$ :矩阵 $\mathbf{A}$ 的每个元素对矩阵 $\mathbf{B}$ 的每个元素求导
求导后的元素个数为 $\mathbf{A}$ 和 $\mathbf{B}$ 的元素个数之积

三.求导秘术：YX拉伸

口诀：1）标量不变，向量拉伸；2）前者横向拉，后者纵向拉
例子：
- $f(x)=f(x_1,x_2,\dots,x_n),x$ 为向量,纵向拉， $x=(x_1,x_2,\dots,x_n)^{\mathrm{T}}$ , $f (x) ： Y$ 为标量不变
  $\frac{\mathrm{d}f}{\mathrm{d}x}=(\frac{\partial{f}}{\partial{x_1}},\frac{\partial{f}}{\partial{x_2}},\dots,\frac{\partial{f}}{\partial{x_n}})^{\mathrm{T}}$
- $f(x)=(f_1(x),f_2(x),\dots,f_n(x))^{\mathrm{T}}$ 为向量,横向拉, $x$ 为标量
  $\frac{\mathrm{d}f}{\mathrm{d}x}=(\frac{\mathrm{d}f_1(x)}{\mathrm{d}x},\frac{\mathrm{d}f_2(x)}{\mathrm{d}x},\dots,\frac{\mathrm{d}f_n(x)}{\mathrm{d}x})$
- $f(x)=(f_1(x),f_2(x),\dots,f_n(x))^{\mathrm{T}},x=(x_1,x_2,\dots,x_n)^{\mathrm{T}}$
$\frac{\mathrm{d}f}{\mathrm{d}x}\xlongequal{先拉x}(\frac{\partial{f}}{\partial{x_1}},\frac{\partial{f}}{\partial{x_2}},\dots,\frac{\partial{f}}{\partial{x_n}})^{\mathrm{T}}\xlongequal{后拉Y}\begin{bmatrix}\frac{\partial{f_1(x)}}{\partial{x_1}}&\frac{\partial{f_2(x)}}{\partial{x_1}}&\dots&\frac{\partial{f_n(x)}}{\partial{x_1}}\\ \frac{\partial{f_1(x)}}{\partial{x_2}}&\frac{\partial{f_2(x)}}{\partial{x_2}}&\dots&\frac{\partial{f_n(x)}}{\partial{x_2}} \\ \dots&\dots&\dots&\dots\\ \frac{\partial{f_1(x)}}{\partial{x_n}}&\frac{\partial{f_2(x)}}{\partial{x_n}}&\dots&\frac{\partial{f_n(x)}}{\partial{x_n}}\end{bmatrix}$

四.常见的矩阵求导

结论：

五.矩阵求导细节补充

六.最小二乘法

天下第一猛男l

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。