关于最优化问题的个人理解以及黑塞矩阵的示例

最新推荐文章于 2024-07-22 00:25:22 发布

MAUM

最新推荐文章于 2024-07-22 00:25:22 发布

阅读量4.4k

点赞数 1

分类专栏：最优化问题文章标签：多元函数最优化

本文链接：https://blog.csdn.net/maum61/article/details/87951516

版权

最优化问题专栏收录该内容

5 篇文章 0 订阅

订阅专栏

首先，关于最优化问题。一直理解不到位，今天终于醍醐灌顶。最优化问题，其实降维之后，就是一元方程的求极值问题。例如，一个一元二次函数， ,求其极小值。显然，高等数学的方法为先求其一阶导数，一阶导为0的点，即是驻点。再求驻点处的二阶导数，假如二阶导数大于零，则该点极小值，假如二阶导小于零，则为极大值。若=0，则不是极值。将该一元方程推广到多元二次方程。其实就是到了数字信号处理或数字图像处理上了，或者是多输入的控制系统。例如现在的Ax=b问题。通过A矩阵对b进行表示，也就是将b投影到A的张成空间中。假如b本来就在A的张成空间中，那么我们希望x的元素尽可能为0，这样便于压缩或者便于提取特征。那么假如b不在A的张成空间中，那么我们希望找到b在A上的投影，这样Ax逼近b的效果最好，也就是希望尽可能的小，该式是Ax和b之间的欧氏距离，也可以理解为Ax和b的误差的能量，这个是我们希望的最重要的一点。另外一点是，x的元素尽可能稀疏，零越多越好。这样有助于我们除去b中的冗余信息，或者说找到能代表b的最少列数的那些列。因此，最优化问题可以描述成，一方面让表示误差足够小，即足够小，另一方面让x比较稀疏，即尽量小。所以目标函数就可以写成：

然后求f(x)的全局最小值即可。但是，是严重不连续的，不便于计算，因此，需要将松弛化（relaxation），那么怎么松弛化？可以松弛化为，k>0。而鉴于l2-norm便捷的计算性能，IRLS算法通过这样的变换，将，k>0转化为l2-norm，详见我的另一篇博文《理论分析IRLS迭代加权最小二乘法（根据Gorodnitsky and Rao）》。这样就易于实现。而BCR算法同样引入了这样的算子，引入，使最优化的条件变得更一般化，条件不再仅限制为，可以自己去造各种限制条件。特殊的，当时，IRLS和BCR的形式就很相似，具体说明见《sparse and redundent representation》书中P119。