Least Squares 最小二乘

说明

本文作为自己学习最小二乘算法的学习笔记,有不对的地方望指正
参考:
书籍 Lecture note. Methods for Non-Linear Least Squares Problems[J]. lecture note.
知乎: https://zhuanlan.zhihu.com/p/38128785.

介绍

最小二乘问题
在这里插入图片描述
最小二乘问题是给定一个函数F,找到F的一个自变量,给出这个所谓的目标函数或成本函数的最小值。这里F(x)是f(x)的二次方合的形式,所以称为最小二乘问题。
最小问题涉及到全局最小和局部最小问题:在这里插入图片描述
在这里插入图片描述
我们假设代价函数F是可微的,并且泰勒展开式是有效的:在这里插入图片描述

这个展开形式是重要的,后面会多次用到

局部最小的条件就是:
在这里插入图片描述

得到一个概念:平衡点(Stationary point)在这里插入图片描述

我们将稳定点带入到1.4a中,可以看出
在这里插入图片描述
根据Hessian的定义(1.4c),任何H都是对称矩阵。如果我们要求Hs是正定的,那么它的特征值大于某个数δ> 0(见《Methods for Non-Linear Least Squares Problems》附件A):
在这里插入图片描述
所以我们找到局部最小的充要条件:在这里插入图片描述

如果Hs是负定的(negative defifinite),那么xs是局部最大值。如果Hs是不定的(indefifinite)(即它有正的和负的特征值),那么xs就是一个鞍点(saddle point)。

下降法

所有的非线性优化方法都是迭代的:从起点x0开始,该方法产生一系列向量x1, x2,…,它(希望)会收敛到x,给定函数的局部最小化器,参见定义1.3。大多数方法都有强制降序条件的措施:
在这里插入图片描述
当x0远离解时,我们希望这个方法产生迭代,迭代会稳定地向x移动。在迭代的这个全局阶段,使错误不增加:
在这里插入图片描述
在迭代的最后阶段,当xk接近x∗时,我们希望更快地收敛。
在这里插入图片描述
在这里插入图片描述

所以下降法的迭代思路就是要找到合理的逼近方向 h 和逼近步长 α:
在这里插入图片描述
所以需要计算方向:
在这里插入图片描述
以及步长:

在这里插入图片描述

The Steepest Descent method

我们可以定义:
在这里插入图片描述
找到最快的下降方向:
在这里插入图片描述
基于(2.8)的算法我们叫做最陡下降法或梯度法

Newton’s Method

在这里插入图片描述
下一次迭代
在这里插入图片描述
详情见书《Methods for Non-Linear Least Squares Problems》的2.2部分

Line Search

在这里插入图片描述
在这里插入图片描述

下降速度为:
在这里插入图片描述

Trust Region and Damped Methods

假设我们有一个F在当前迭代x的邻域内的行为模型L:
在这里插入图片描述
通常,这个模型是F在x附近的二阶泰勒展开,就像(1.4a)右边的前三项,或者L(h)可能是这个展开的近似。一般来说,只有当h足够小时,这样的模型才是好的。书中介绍两种方法:

trust region method

我们假设我们知道一个正数∆,使得模型在一个半径为∆,以x为中心的球内足够准确,并确定步长为
在这里插入图片描述

damped method

在这里插入图片描述
代入2.14可以看出:
在这里插入图片描述
为了防止步长带来的h太大带来的风险 通过增益比(gain ratio),评估具有计算步骤的模型的质量
在这里插入图片描述
最后得到Nielsen (1999)相关策略:
在这里插入图片描述
初始:ν = 2。

最小二乘

最小二乘问题可以用一般的优化方法来解决,但我们将提出更有效的特殊方法。在许多情况下,它们比线性收敛性更好,有时甚至是二次收敛性,即使它们不需要实现二阶导数。在本章方法的描述中,我们需要F的导数的公式:假设F有连续的二阶偏导数,我们可以把它的泰勒展开式写成
在这里插入图片描述
其中J就是雅克比矩阵(Jacobian)
在这里插入图片描述
所以
在这里插入图片描述
并且
在这里插入图片描述

The Gauss–Newton Method

高斯-牛顿方法是基于向量函数各分量的一阶导数实现的。在特殊情况下,它可以给出二次收敛,就像牛顿法对一般优化所做的那样,参见Frandsen等人(2004)。高斯牛顿法是基于f (f的线性模型)在x附近的分量的线性近似:对于小的||h||,我们可以从泰勒展开式(3.2)中看到
在这里插入图片描述
所以
在这里插入图片描述
h的方向:
在这里插入图片描述
所以对于算法2.4:
在这里插入图片描述

The Levenberg–Marquardt Method

Levenberg(1944)和后来的Marquardt(1963)建议使用阻尼高斯-牛顿法。步骤hlm是通过以下修改来定义的:
在这里插入图片描述
算法:
在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值