机器学习的数学基础（一）

最新推荐文章于 2023-12-31 18:48:11 发布

章政兴

最新推荐文章于 2023-12-31 18:48:11 发布

阅读量1.2k

点赞数 3

分类专栏：机器学习文章标签：机器学习数学基础线性代数人工智能多变量微积分

本文链接：https://blog.csdn.net/weixin_43144524/article/details/86748028

版权

三道试题第一题

不是序

从15年开始真正接触机器学习，也尝试着看了一些书，比如《机器学习》（周志华）、《统计机器学习》（李航）、《机器学习实战》等等；一直对于相关数学应该掌握到什么程度心存疑虑，有的数学相对艰深，推导和证明比较花时间，但是直接略过之后，发现看后续的内容会雪崩式的夹生饭；直到学完了Stanford CS229《Machine Learning》，逼着自己在规定时间内做完所有的习题和编程作业，觉得比较有收获，所谓吾尝终日而思矣，不如须臾之所学也。
机器学习的重要的数学基础之一是线性代数和多变量微积分（Linear Algebra & Multivariable Calculus）。对于这门学科要掌握到什么程度?请弄懂三道试题即可。

第一题：Gradients and Hessians
题目
Recall that a matrix $A\in{R}^{n\times n}$ is symmetric if $A^T=A$ , that is, ${A}_{ij}={A}_{ji}$ for all i, j. Also
recall the gradient $\triangledown f(x)$ of a function $f:{R}^{n} \rightarrow n$ which is the n-vector of partial derivatives. $\triangledown f(x) = \begin{bmatrix} \frac { \partial }{ \partial { x }_{ 1 } }f(x)\\ \vdots\\ \frac { \partial }{ \partial { x }_{ n }}f(x) \end{bmatrix} \quad where \quad x = \begin{bmatrix} {x}_{1} \\ \vdots \\ {x}_{n} \end{bmatrix}$
The hessian ${\triangledown}^{2}f(x)$ of a function $f:{R}^{n} \rightarrow R$ is the $\times n$ symmetric matrix of twice partial derivatives,
$\begin{bmatrix} \frac{ {\partial}^{2}}{\partial {x}_{1}^{2}}f(x) & \frac{ {\partial}^{2}}{\partial {x}_{1} {x}_{2}}f(x) & \cdots & \frac{ {\partial}^{2}}{\partial {x}_{1} \partial {x}_{n}}f(x) \\ \frac{ {\partial}^{2}}{\partial {x}_{2}{x}_{1}}f(x) & \frac{ {\partial}^{2}}{\partial {x}_{2}^{2}}f(x) & \cdots & \frac{ {\partial}^{2}}{\partial {x}_{2} \partial {x}_{n}}f(x) \\ \vdots & \vdots & \ddots &\vdots \\ \frac{ {\partial}^{2}}{\partial {x}_{n}{x}_{1}}f(x) & \frac{ {\partial}^{2}}{\partial {x}_{n}{x}_{2}}f(x) & \cdots & \frac{ {\partial}^{2}}{\partial {x}_{n}^{2}}f(x) \end{bmatrix}$
第一问
Let $f(x)=\frac{1}{2}{x}^{T}Ax + {b}^{T}x$ where A is a symmetric matrix and $\in {R}^{n}$ is a vector. What is $\triangledown f(x)$ ?

第一答
设 $\begin{bmatrix} {R}_{1} \\ {R}_{2} \\ \cdots \\ {R}_{n} \end{bmatrix}$ 其中: ${R}_{i} = \begin{bmatrix} {A}_{i1} \quad {A}_{i2} \quad \cdots \quad {A}_{in} \end{bmatrix}$
设