岭参数\正则化参数的选取方法

芝士雪豹_cyber

已于 2024-06-21 11:14:07 修改

阅读量3.9k

点赞数 4

文章标签：矩阵

于 2022-09-30 11:40:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50155907/article/details/127119207

版权

背景

在最小二乘解不稳定的情况下，利用岭估计解决类似L = A*X-e的观测方程，A的阶数为m*n（m>=n，rank(A) = n)，cond(A'A)数量级较大

估计准则由 $||AX-L||^{2}=min$ 转为 $||AX-L||^{2}+\alpha ||X||^{2}=min$

其中 $\alpha$ 为岭参数，目前常用岭参数确定方法包括岭迹法、L曲线法、GCV法、最小均方误差法。

1、岭迹法

通过取不同的岭参数，根据式 $X = (A'PA+\alpha *I)^{-1}A'PL$ 得到对应的岭估计值，画出（a,X(i))的函数图像（i = 1，2……m)，使得任一X（i)都趋于稳定的a值即为岭参数。这样的选取方法具有随意性，受人为影响较大。

2、L-Curve

由Hansen提出，在岭估计的准则||AX-L||p^2+a*||X||p^2 = min中，残差范数与解范数可以看作关于a的函数。在关于（||AX- L||,||X||)的图像中，曲率最大值点即为岭参数。在实际求解中，通常取对数n = lg(||AX- L||^2),p = lg(||X||^2)，n',n'',p',p''分别为n,p关于a的一阶与二阶导数，则有：

$\alpha = max(2*\frac{n'*p''-p'*n''}{(n'^{2}+p'^{2})^{3/2}})$

根据L曲线取得的岭参数并非最优解，只是近似最优。

3、GCV（generalized cross validation)

GCV确定正则化参数的理论依据为使验后单位权中误差最小，即最大程度信任观测值。由此构造出GCV函数，当GCV函数取得最小值时，对应的a即为岭参数。GCV函数如下：

$GCV=\frac{\frac{1}{n}||L-H(\alpha )L||}{(\frac{1}{n}Trace(I-H(\alpha )))^{2}}$

其中: $H(\alpha )=A(A'A+\alpha I)^{-1}A'$

当GCV函数最小值存在时，GCV函数能取得最优岭参数，但当函数单调递减（虽然收敛，但只能取得所设置的边界值），并不能取得最优岭参数。

4、最小均方误差法（minimum mean square error）

当方程病态时，方差基本已不能形容解的精确度，此时提出一个评价指标MSE(mean square error)对解的精度确度进行评估。

$MSE\left ( \hat{x} \right ) = E\left ( {\left ( \hat{x}-\bar{x} \right )}' \cdot\left ( \hat{x}-\bar{x} \right ) \right )$

均方误差与方差的关系式如下：

$MSE\left ( \hat{x} \right ) = trace(D\left (\hat{ x} \right ))+b_{\hat{x}}^{'}\cdot b_{\hat{x}}$

$b_{\hat{x}} = E\left ( \hat{x} \right )-\bar{x}$

显然，当仍采用最小二乘时，未知参数的期望就是其真值，偏差bx为0，均方误差即等于方差取迹（此时偏差虽为0，但方差极大）。但采用岭估计时，此时解有偏，bx不为0。对均方误差的描述如上，以下介绍通过均方误差最小确定正则化的思路。

（1）由于未知参数真值未知，用其近似值代替。先设一个初始正则化参数a，也可由前面几种方法得到，得到一个未知参数估值。

（2）再令正则化参数为0~1（范围根据病态程度确定，不一定为0~1）。步长h根据所需精度设置。以第一步得到的近似解代替真值，求出正则化参数为0:h:1时的均方误差。

（3）得到均方误差最小时对应的参数amin，再令a = amin。

（4）重复步骤（1）~（3）。直至满足

$\left |a-amin \right |<\sigma$ 或者 $\left |minMSE \right |<\lambda$

其中σ与λ是人为设置的迭代终止条件。

经上述步骤即可得到由均方误差最小法对应的正则化参数。

芝士雪豹_cyber

博客等级

码龄5年

2
原创

6
点赞

28
收藏

5
粉丝

关注

私信

热门文章

最新评论

岭参数\正则化参数的选取方法
陈卓婷: 您好，请问下这几个方法的相关代码方便发给我参考嘛？
岭参数\正则化参数的选取方法
芝士雪豹_cyber: 我的方向只涉及实数矩阵，抱歉不能解释
岭参数\正则化参数的选取方法
人道山长山又断: GCV那里，请问对复数矩阵，算出来是复数，这个怎么理解呢
岭参数\正则化参数的选取方法
Rebecca_28: 您好，请问有这几个方法的相关代码吗？
利用ArcGIS由边界坐标文件外扩
CSDN-Ada助手: 非常感谢您分享的第二篇博客！您的博文标题和摘要激发了我对ArcGIS的兴趣，并且我很期待阅读您的详细操作流程。您的创作对于那些需要在地理研究中进行区域外扩的人来说一定非常有帮助。除了您在标题和摘要中提到的内容，我想分享一些与该博文相关的扩展知识和技能。首先，了解如何使用ArcGIS中的"Buffer"工具可以帮助您在地图上创建一个区域边界的缓冲区。这将对那些需要对研究区域进行进一步分析的人非常有用。另外，掌握ArcGIS中的"Clip"工具可以帮助您从一个地理数据集中剪切出特定区域的数据，这在研究中也是非常常见的操作。再次感谢您的分享，期待您的持续创作！如果您有任何疑问或需要进一步的帮助，请随时向我们提问。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

利用ArcGIS由边界坐标文件外扩

目录

展开全部

收起

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。