第十一章番外对偶问题

最新推荐文章于 2024-09-12 21:05:39 发布

zz_wen

最新推荐文章于 2024-09-12 21:05:39 发布

阅读量485

点赞数 13

文章标签：机器学习

本文链接：https://blog.csdn.net/zz_wen/article/details/141597976

版权

对偶问题（Dual Problem）是优化理论中的一个重要概念，它与原问题（Primal Problem）相对应。在数学优化中，对偶问题是从原问题出发构造出来的一个新的优化问题。对偶问题的主要目的是简化原问题的求解，并且在某些情况下，对偶问题的解可以直接给出原问题的解。下面我们详细解释对偶问题的概念。

原问题

假设我们有一个标准形式的最优化问题（原问题），它可以表示为：
$\begin{aligned} & \text{minimize} & & f_0(\mathbf{x}) \ & \text{subject to} & & f_i(\mathbf{x}) \leq 0, \quad i = 1, \ldots, m \ &&& h_i(\mathbf{x}) = 0, \quad i = 1, \ldots, p, \end{aligned}$
其中 $f_0(\mathbf{x})$ 是目标函数， $f_i(\mathbf{x})$ 是不等式约束函数， $h_i(\mathbf{x})$ 是等式约束函数， $\mathbf{x}$ 是决策变量。

拉格朗日函数

为了构造对偶问题，我们首先定义拉格朗日函数（Lagrangian function）：
$\mathcal{L}(\mathbf{x}, \boldsymbol{\lambda}, \boldsymbol{\nu}) = f_0(\mathbf{x}) + \sum_{i=1}{m} \lambda_i f_i(\mathbf{x}) + \sum_{i=1}{p} \nu_i h_i(\mathbf{x}),$
其中 $\boldsymbol{\lambda} = (\lambda_1, \ldots, \lambda_m)$ 和 $\boldsymbol{\nu} = (\nu_1, \ldots, \nu_p)$ 分别是不等式约束和等式约束的拉格朗日乘子向量。

对偶函数

接下来，我们定义对偶函数（Dual Function）:
$g(\boldsymbol{\lambda}, \boldsymbol{\nu}) = \inf_{\mathbf{x}} \mathcal{L}(\mathbf{x}, \boldsymbol{\lambda}, \boldsymbol{\nu}),$
其中 $\inf_{\mathbf{x}}$ 表示在所有可行的 $\mathbf{x}$ 中取最小值。

对偶问题

最终，我们得到的对偶问题（Dual Problem）可以表示为：
$\begin{aligned} & \text{maximize} & & g(\boldsymbol{\lambda}, \boldsymbol{\nu}) \ & \text{subject to} & & \lambda_i \geq 0, \quad i = 1, \ldots, m. \end{aligned}$

弱对偶性

弱对偶性（Weak Duality）指的是原问题的最优值总是大于等于对偶问题的最优值：
$\geq g,$ _
其中 (f^_) 是原问题的最优值， $g^*$ 是对偶问题的最优值。

强对偶性

强对偶性（Strong Duality）指的是在一定条件下，原问题和对偶问题的最优值相等：
$f * = g *,$
这种情况下，求解对偶问题可以直接给出原问题的解。

应用示例

让我们来看一个具体的例子，假设我们有以下原问题：
$\begin{aligned} & \text{minimize} & & x_1 - 4x_2 \ & \text{subject to} & & -x_1 + 3x_2 \leq 3 \ &&& x_1 + x_2 \leq 3 \ &&& x_1, x_2 \geq 0. \end{aligned}$
构造拉格朗日函数：
$\mathcal{L}(x_1, x_2, \lambda_1, \lambda_2) = x_1 - 4x_2 + \lambda_1 (-x_1 + 3x_2 - 3) + \lambda_2 (x_1 + x_2 - 3).$
对偶函数为：
$g(\lambda_1, \lambda_2) = \inf_{x_1, x_2} \mathcal{L}(x_1, x_2, \lambda_1, \lambda_2).$
求解对偶问题：
$\begin{aligned} & \text{maximize} & & g(\lambda_1, \lambda_2) \ & \text{subject to} & & \lambda_1 \geq 0 \ &&& \lambda_2 \geq 0. \end{aligned}$

在支持向量机中的应用

在支持向量机（SVM）中，我们通过构造拉格朗日函数来找到最大间隔超平面。原问题可以表示为：
$\begin{aligned} & \text{minimize} & & \frac{1}{2} |\mathbf{w}|^2 \ & \text{subject to} & & y_i (\mathbf{w}^\top \mathbf{x}_i + b) \geq 1, \quad i = 1, \ldots, n. \end{aligned}$
通过引入拉格朗日乘子 (\boldsymbol{\alpha})，构造拉格朗日函数，并求解对偶问题：
$\begin{aligned} & \text{maximize} & & W(\boldsymbol{\alpha}) = \sum_{i=1}{n} \alpha_i - \frac{1}{2} \sum_{i,j=1}{n} \alpha_i \alpha_j y_i y_j \mathbf{x}_i^\top \mathbf{x}j \ & \text{subject to} & & 0 \leq \alpha_i \leq C, \quad i = 1, \ldots, n \ &&& \sum{i=1}^{n} \alpha_i y_i = 0. \end{aligned}$
对偶问题的解 $\boldsymbol{\alpha}$ 可以用来计算 $\mathbf{w}$ 和 b，进而得到最大间隔超平面。

zz_wen

关注

13
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
第十一章番外对偶问题

对偶问题（Dual Problem）是优化理论中的一个重要概念，它与原问题（Primal Problem）相对应。在数学优化中，对偶问题是从原问题出发构造出来的一个新的优化问题。对偶问题的主要目的是简化原问题的求解，并且在某些情况下，对偶问题的解可以直接给出原问题的解。下面我们详细解释对偶问题的概念。
复制链接

扫一扫