无条件最优化问题的求解方法
1.无约束优化问题
(1)
其中 是二次可微凸函数(意味着是开集)。表示最优值。
最优点应该满足下述充要条件
(2)
因此求解无约束最优化问题(1)等价于求解个变量的个方程(2),但是一般情况下必须采用迭代算法求解(2),即计算点列 使得时,当时算法终止。
2.强凸性
假设目标函数在上是强凸的,这是指存在,使得
(3)
对于,我们有
对两边就极值,是凸函数,其最优解为,则有
由于该不等式对所有成立,所以有
因此可以看出任何梯度足够小都可以近似最优解。即令足够小,都是近似最优解。
对于和任意最优解之间的距离,也可以建立正比于的上界,
,证明如下
利用柯西施瓦兹不等式有,
,由于
所以有
得证。
2.下降的方法
此处描述算法将产生一个优化点列其中
并且有,被成为第k次迭代的步长,为搜索方向。所有的下降方法,都要满足只要不是最优点就成立:
由凸性可知,
因此一个下降方法中的搜索方向必须满足,即搜索方向必须与负梯度方向是锐角。
下降方向由交替进进行的两个步骤构成:确定下降方向,选择步长。其一般框架如下:
算法1 通用下降算法
给定 初始点
重复进行
1.确定下降方向。
2.直线搜索。选择步长.
3.修改。
精确直线搜索
是通过沿着射线优化而确定:
回溯直线搜索
通过沿着射线近似优化确定步长,甚至只要有足够的减少即可。
算法2 回溯直线搜索
给定在处的下降方向,参数
t:=1
如果,令。
3.梯度下降的方法
由于一个下降方法中的搜索方向必须满足,即搜索方向必须与负梯度方向是锐角。
因此用负梯度作搜索方向,是一种自然的选择。
ps:为什么梯度下降是最快下降方向呢?
当为180度时,取得最小值。
3.1 采用精准直线搜索收敛性分析
由于有,
将 代入可以得到
对上面不等式两边求极值可以,可以得到:
两边减去,有
又因为有,则可以得到
重复应用以上不等式,可以看出
,其中,所以,趋于0。 特别是至多经过
次迭代一定可以达到。
4.Newton方法
对于,我们称向量
为Newton步径,由于 正定,除非,否则
二阶近似的最优解
函数 在处的二阶Taylor近似为
,这里是关于的二次凸函数,
通过一阶导求极值可以得到时达到最小值。