【最优化方法】无约束非线性函数

最新推荐文章于 2022-08-24 22:35:15 发布

Scau_Jack

最新推荐文章于 2022-08-24 22:35:15 发布

阅读量398

点赞数

分类专栏：概率图模型统计学习方法

本文链接：https://blog.csdn.net/Scau_Jack/article/details/110226824

版权

概率图模型同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

统计学习方法

3 篇文章 0 订阅

订阅专栏

向量投影证明

$b_1 = d * \frac{a_1}{|a_1|} \\ d = |a_2| * cos\theta \\ cos = \frac{(a_2,a_1)}{|a_2||a_1|}$
由上面3个式子最终得到
$\frac{(a_2,a_1)}{(a_1,a_1) } a_1$

施密特正交化

我们想要构造正交的基坐标系，我们希望各个坐标最好是能够互相正交的，我们让
$b_1 = a_1$
另一个坐标应该是 $b_2$ ，这个坐标可以根据向量的运算得到
$b_2 = a_2 - b_1 \\ b_1 = \frac{a_2,b_1}{(b_1,b_1)} b1$
拓展到高维度也是同样道理，具体可以参考施密特正交化高维度的方法。

最速下降法

二次型

二次型是一个从向量到标量的函数：
$\frac{1}{2} x^{T} A x - bx + c$
它的导数是:
$\\ Ax = b$
我们可以将计算 $A x = b$ 转为计算二次型的最值问题。
在这里插入图片描述
上图为不同的 A 对 f(x) 的图像的影响。(a)正定矩阵的二次型;(b)负定矩阵的二次型;©奇异矩阵和非正定矩阵的二次型;(d)不定矩阵的二次型:此时解是一个鞍点，梯度法和 CG 均无法处理该问题。

下降方向

最速下降法也就是梯度法，其中梯度是函数值变化最大的方向。最终通过求导的方式来确定步长。
$\nabla f(\bold x) \\ x_{i+1} = x_i + \alpha d \\$

证明垂直和最佳步长

现在我们已经确定了下降方向，接下来我们要确定下降的步长 $\alpha$ , 步长我们我们使用精准的公式法进行计算。我们令函数为关于
$\psi(\alpha) = f(x_{i+1}) \\ \\ \nabla \psi(\alpha)=\frac{\partial f(x_{i+1})}{\partial \alpha} = \frac{\partial f(x_{i+1})}{\partial x_{i+1}} \frac{\partial x_{i+1}}{\partial \alpha} = (A\bold x_{i+1} -b) \bold d_i = d_{i+1} d_i = 0$
所以证明了两次的搜索方向是互相垂直的。下面将计算出 $\alpha$ 的具体数值:
$\bold d_{i+1} \bold d_i \\ = (A\bold x_{i+1} - b)^T \bold d \\ = (A(x_i + \alpha d) - b)^T d_i \\ = (Ax_i + \alpha A d_i -b)^T d_i \\ = (Ax_i -b + \alpha A d_i)^Td_i \\ = ( -d_i + \alpha A d_i)^T d_i \\= -d_i ^T d_i + \alpha d^T_i A d_{i} =0$
化简得到

$\alpha = \frac{d_i^Td_i}{d_i^TAd_i}$

共轭梯度下降

###

Scau_Jack

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【最优化方法】无约束非线性函数

向量投影证明[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UDC3ZOKm-1606460904224)(b1=d∗a1∣a1∣d=∣a2∣∗cosθcos=(a2,a1)∣a2∣∣a1∣ b_1 = d * \frac{a_1}{|a_1|} \\ d = |a_2| * cos\theta \\ cos = \frac{(a_2,a_1)}{|a_2||a_1|}b1=d∗∣a1∣a1d=∣a2∣∗cosθcos=∣a2∣∣a1∣(a2,
复制链接

扫一扫