【鲁棒优化】| 补充证明:为什么最优解时一定有$y^{*} = |x^{*}|$ (论文笔记：The Price of Robustness)

本文链接：https://blog.csdn.net/HsinglukLiu/article/details/123279681

【鲁棒优化】| 补充证明:为什么最优解时一定有$y^{} = |x^{}|$

作者：刘兴禄，清华大学，博士在读

欢迎关注我们的微信公众号 运小筹

在这里插入图片描述

上篇推文有一处证明我省略了，个别小伙伴觉得想不清楚，来问我了。我这里写个补充证明分享给大家。

另外上篇推文也有几处小笔误，由于文章不能更改了，这里来更正一下。在文章的最后部分。

补充证明：为什么最优解时一定有 $y^{} = |x^{}|$

这个说起来很直观，但是我还是来证明一下：

命题：考虑下面的问题
$\begin{aligned} \max \quad & \mathbf{cx} \\ s.t. \quad & \sum_{j}{a_{ij}x_j}+\sum_{j\in J_i}{\hat{a}_{ij}y_j}\leqslant b_i, \quad &\forall i \\ &y_j \geqslant |x_j| , &&\forall j \\ &\mathbf{l}\leqslant \mathbf{x}\leqslant \mathbf{u}&& \\ &\mathbf{y}\geqslant 0&& \end{aligned}$
则在最优解中，一定有 $y^{*}=|x^{*}|$ 。

证明：
（反证法）假设最优解为 $(\mathbf{y}^{*}, \mathbf{x}^{*})$ , 根据约束，他们一定满足 $\mathbf{y}^{*}\geqslant |\mathbf{x}^{*}|$ 。

这里包含且仅包含两种情形： $\mathbf{y}^{*}> |\mathbf{x}^{*}|$ 或者 $\mathbf{y}^{*} = |\mathbf{x}^{*}|$ 。

如果最优解满足： $\mathbf{y}^{*} > |\mathbf{x}^{*}|$ ，约束2显然满足。

我们再来分析约束1。根据 $|\mathbf{x}^{*}| < \mathbf{y}^{*}$ ，可得
$\begin{aligned} \sum_{j}{a_{ij}x_j^{*}}+\sum_{j\in J_i}{\hat{a}_{ij}x_j^{*}} < \sum_{j}{a_{ij}x_j^{*}}+\sum_{j\in J_i}{\hat{a}_{ij}y_j^{*}}\leqslant b_i, \quad &\forall i \hspace{1cm} (*) \end{aligned}$
由于目标函数为 $\max \, \mathbf{cx}$ ，随着 $\mathbf{x}$ 增大，单调递增。而 $(*)$ 式显示，一定 $\exist x_j^{*}$ 还有可以增大的空间，并且使得原问题可行。因此我们有，必然 $\exist (\bar{\mathbf{y}}, \bar{\mathbf{x}})$ 使得原问题可行（这里其实更专业的写法是写成 $\exist (\bar{\mathbf{y}}, \bar{\mathbf{x}}) \in \mathbf{S}$ ，其中 $\mathbf{S}$ 表示上述问题的可行域，意思就是说这个也是个可行解。这里我只是提及一下），并且使得 $\bar{\mathbf{x}}$ 中所有分量都不小于 $\mathbf{x}^{*}$ 的分量，即
$\bar{x}_j \geqslant x_j^{*}, \quad \forall j$ 。并且至少存在一个分量严格大于 $\mathbf{x}^{*}$ 的分量，即并且 $\exist j'$ ，满足
$\begin{aligned} \bar{x}_{j'} > x_{j'}^{*} \end{aligned}$
由于 $(\bar{\mathbf{y}}, \bar{\mathbf{x}})$ 是可行解，所以下面条件一定满足（实际上这一句可以不要）
$\begin{aligned} \sum_{j}{a_{ij}\bar{x}_j}+\sum_{j\in J_i}{\hat{a}_{ij}\bar{y}_j}\leqslant b_i \end{aligned}$
因此，可行解 $(\bar{\mathbf{y}}, \bar{\mathbf{x}})$ 必然导致 $\mathbf{c\bar{\mathbf{x}}} > \mathbf{c\mathbf{x}^{*}}$ ，从而推出 $(\mathbf{y}^{*}, \mathbf{x}^{*})$ 不是最优解。但是这与原假设矛盾。所以我们得出，另外一种情况必然成立，即 $\mathbf{y}^{*} = |\mathbf{x}^{*}|$ 。

综上，若 $(\mathbf{y}^{*}, \mathbf{x}^{*})$ 为问题的最优解，则一定满足 $\mathbf{y}^{*} = |\mathbf{x}^{*}|$ 。原命题得证。

拓展：符合条件的 $j^{'}$ 如何找？为什么一定存在 $j^{'}$ 使得 $x_j$ 增大且原问题可行

上面已经证明了原命题，其实只需要做到上面的部分，这个问题就可以结束了。不过，我还是想从纯数学语言的角度来证明上面的一句话：

一定 $\exist x_j^{*}$ 还有可以增大的空间，并且使得原问题可行。

这句话，我还是想继续来硬钢一下，也顺便练练手。

先把这一段搬过来

必然 $\exist (\bar{\mathbf{y}}, \bar{\mathbf{x}})$ 使得原问题可行（这里其实更专业的写法是写成 $\exist (\bar{\mathbf{y}}, \bar{\mathbf{x}}) \in \mathbf{S}$ ，其中 $\mathbf{S}$ 表示上述问题的可行域，意思就是说这个也是个可行解。这里我只是提及一下），并且使得 $\bar{\mathbf{x}}$ 中所有分量都不小于 $\mathbf{x}^{*}$ 的分量，即
$\bar{x}_j \geqslant x_j^{*}, \quad \forall j$ 。并且至少存在一个分量严格大于 $\mathbf{x}^{*}$ 的分量，即并且 $\exist j'$ ，满足
$\begin{aligned} \bar{x}_{j'} > x_{j'}^{*} \end{aligned}$

这一部分，如果要再用数学语言表达的精确一些，就是：

必然存在正数 $\epsilon_1, \epsilon_2 >0$ 以及至少存在一对下标 $j_1, j_2$ 满足下面的条件：

令 $\bar{x}_{j_1} = x_{j_1}^{*} + \epsilon_1$ ， $\bar{y}_{j_2} = y_{j_2}^{*} - \epsilon_2$ ，且
满足 $\begin{aligned} \sum_{j \ne j_1}{a_{ij}x_j^{*}}+\sum_{j\in J_i, j\ne j_2}{\hat{a}_{ij}y_j^{*}} + \left[a_{i,j_1}\bar{x}_{j_1} + \hat{a}_{i,j_2}\bar{y}_{j_2} \right]\leqslant b_i, \quad \forall i \end{aligned}$

满足上面条件的 $\epsilon_1, \epsilon_2 >0$ 比较好找，只需要满足
$\begin{aligned} a_{i,j_1}\bar{x}_{j_1} + \hat{a}_{i,j_2}\bar{y}_{j_2} \leqslant a_{i,j_1}x_{j_1}^{*} + \hat{a}_{i,j_2}y_{j_2}^{*} \quad \forall i \end{aligned}$
即可。即
$\begin{aligned} a_{i,j_1} (x_{j_1}^{*} + \epsilon_1) + \hat{a}_{i,j_2}(y_{j_2}^{*} - \epsilon_2) \leqslant a_{i,j_1}x_{j_1}^{*} + \hat{a}_{i,j_2}y_{j_2}^{*} \quad \forall i \end{aligned}$
整理得
$\begin{aligned} & \quad a_{i,j_1} \cdot \epsilon_1 - \hat{a}_{i,j_2} \cdot \epsilon_2 \leqslant 0 \quad \forall i \\ \Longleftrightarrow& \quad a_{i,j_1} \cdot \epsilon_1 \leqslant \hat{a}_{i,j_2} \cdot \epsilon_2 \quad \forall i \\ \Longleftrightarrow& \quad \frac{\epsilon_1}{\epsilon_2} \leqslant \frac{\hat{a}_{i,j_2}}{a_{i,j_1}} \quad \forall i \\ \Longleftrightarrow& \quad \frac{\epsilon_1}{\epsilon_2} \leqslant \underset{i}{\min} \left\{ \frac{\hat{a}_{i,j_2}}{a_{i,j_1}} \right\} = \beta_0\quad \hspace{1cm} (**) \end{aligned}$

所以，只需要取 $\epsilon_1, \epsilon_2 >0$ ，且 $\epsilon_1 \leqslant x_{j_1}^{*}, \epsilon_2 \leqslant y_{j_2}^{*}$ ，使得 $\frac{\epsilon_1}{\epsilon_2} \leqslant \beta_0$ 即可。
下面来解释一对下标 $j_1, j_2$ 如何选取（这里令所有变量下标集合为 $J$ ）。
我们令 $I_1 = \{j | x_j < \mathbf{u}_j, |x_j| < y_j, \forall j \in J\}$
令 $I_2 = \{j | y_j > |x_j|\}$ .

具体操作方法：

从 $I_1$ 中选取任意一个元素作为 $j_1$ ；从 $I_2$ 中选取任意一个元素作为 $j_2$ ；
根据 $\beta_0=\underset{i}{\min} \left\{ \frac{\hat{a}_{i,j_2}}{a_{i,j_1}} \right\}$ 计算 $\beta_0$ ;
根据 $\frac{\epsilon_1}{\epsilon_2} \leqslant \beta_0$ ，选择适合的 $\epsilon_1, \epsilon_2$ 即可。

找到了 $\epsilon_1, \epsilon_2$ 和 $j_1, j_2$ ，我们就可以将 $(\mathbf{y}^{*}, \mathbf{x}^{*})$ 中的值做以
下更新： $\bar{x}_{j_1} = x_{j_1}^{*} + \epsilon_1$ ， $\bar{y}_{j_2} = y_{j_2}^{*} - \epsilon_2$ ，这样就可以得到
新的解 $\mathbf{\bar{x}}$ ，这个 $\mathbf{\bar{x}}$ 就可以使得 $\mathbf{c\bar{\mathbf{x}}} > \mathbf{c\mathbf{x}^{*}}$ 。