惩罚因子（penalty term）与损失函数（loss function）

最新推荐文章于 2025-03-02 17:12:12 发布

Vic_Hao

最新推荐文章于 2025-03-02 17:12:12 发布

阅读量9.6k

点赞数 6

分类专栏：优化

优化专栏收录该内容

4 篇文章

订阅专栏

penalty term和loss function看起来很相似，但其实二者完全不同。

惩罚因子

penalty term的作用就是把约束优化问题转化为非受限优化问题。
比如我们要优化：
$min\quad f(x) = x^2 - 10x$ $s.t.\quad g(x) = x -3 \leqslant 0$

我们可以利用惩罚因子，将上述问题转化为非约束优化问题，也就是拿掉 $g (x)$ 的限制。
则函数变为：
$min\quad P(x, s, r) = x^2 - 10x + sr\phi(x -3)$
其中， $s =$ 1或-1; $r$ 是控制变量，单调增或减; $\phi$ 是惩罚函数。

如果我们令 $s = 1, r = 1$ ， $\phi = x^2$ , 则：
$min\quad P(x, s, r) = x^2 - 10x + (x-3)^2$
最终得到的结果是错的，原因是r太小，如果我们将r=100，最终就能得到对的结果。也就是说，在迭代优化过程中，r是单调变量，如果优化结果不满足约束条件，那么可调节r的值，继续迭代，直至满足为止。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。