1. 基本概念
罚函数法又称乘子法,是将约束优化问题转换为无约束最优化问题的方法之一。其基本思想就是通过在原始的目标函数中添加一个障碍函数(也可以理解成惩罚函数)来代替约束条件中的不等式约束。如果当前解不满足约束条件,就在目标项上加上一个正向的惩罚(这里考虑的都是最小化问题),强迫当前解往可行域的方向走。至于正向惩罚的力度,取决于所用的映射函数,即惩罚函数。
2. 数学定义
考虑约束优化问题:
1) 对于等式约束问题,
可采用前面提到的拉格朗日乘子法。这里我们做一些简化,对每个约束项采用相同的权重,定义如下辅助函数:
其中,δ
\deltaδ为足够大的正数。注意,这里的约束项都加了平方。前面我们提过了,不满足约束要加上一个正向的惩罚。为了保证正向这个条件