（《机器学习》完整版系列）第6章支持向量机SVM——6.3 何为松驰变量（当搜寻范围扩大时，可能会找到更高的山、更低的谷）

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129206857

松驰变量的理解是难点之一，也是很有意思的内容。

松驰变量

我们先描述一个事实：当搜寻范围扩大时，可能会找到更高的山、更低的谷，即
$\begin{align} \text{若}\ A\subseteq B,\ \text{则}\ \begin{cases} \,\mathop{\max}\limits_{\boldsymbol{x}\in A}f(\boldsymbol{x})\leqslant \mathop{\max}\limits_{\boldsymbol{x}\in B}f(\boldsymbol{x}) \\ \,\mathop{\min}\limits_{\boldsymbol{x}\in A}f(\boldsymbol{x})\geqslant \mathop{\min}\limits_{\boldsymbol{x}\in B}f(\boldsymbol{x}) \\ \end{cases} \tag{6.16} \end{align}$

设 $1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b)<0$ 的 $i$ 形成下标集 $D_-$ ， $1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b)\geqslant 0$ 的 $i$ 形成下标集 $D_+$ ，再作于关于点 $(\boldsymbol{w},b,\boldsymbol{\xi} )$ 的集合： $A=\{(\boldsymbol{w},b,\boldsymbol{\xi} ):\, \xi _i=1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b),\xi _i\geqslant 0\}$ ， $B=\{(\boldsymbol{w},b,\boldsymbol{\xi} ):\, \xi _i\geqslant 1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b),\xi _i\geqslant 0\}$ （这里的“ $\geqslant$ ”也可以全都换成“ $\leqslant$ ”），则有： $A\subseteq B$ 。

再在我们对优化目标【西瓜书式(6.34)】进行变换：
$\begin{align} & \ \mathop{\min}\limits_{\boldsymbol{w},b}\frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i=1}^m \max (0,1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b))\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b} \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i\in D_+\bigcup D_-} \max (0,1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b))\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b}\ \frac{1}{2}||\boldsymbol{w}||^2+C\left(\sum_{i\in D_+} (1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b))+\sum_{i\in D_-} 0\right)\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b}\ \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i} (1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b)),\quad \mathrm{s.t.} \quad {i\in D_+}\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b}\ \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i} (1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b))\notag \\ & \qquad \qquad \qquad \mathrm{s.t.} \quad 1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b)\geqslant 0\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b,\boldsymbol{\xi}}\ \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i} \xi _i\notag \\ & \qquad \qquad \qquad \mathrm{s.t.} \quad \xi _i=1-y_i(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_i+b),\ \xi _i\geqslant 0\notag \\ & =\mathop{\min}\limits_{\boldsymbol{w},b,\boldsymbol{\xi}}\ \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i} \xi _i\notag \\ & \qquad \qquad \qquad \mathrm{s.t.} \quad (\boldsymbol{w},b,\boldsymbol{\xi}) \in A\notag \\ & \geqslant \mathop{\min}\limits_{\boldsymbol{w},b,\boldsymbol{\xi}}\ \frac{1}{2}||\boldsymbol{w}||^2+C\sum_{i} \xi _i\notag \\ & \qquad \qquad \qquad \mathrm{s.t.} \quad (\boldsymbol{w},b,\boldsymbol{\xi}) \in B \quad \text{（由式(6.16)）} \tag{6.17} \end{align}$
这即为【西瓜书式(6.35)】，由此将无约束的目标【西瓜书式(6.34)】，变为有约束的目标【西瓜书式(6.35)】，
此时，约束变量 ${\xi }_i$ 为自变量，称为“松驰变量”，它为一组 $\boldsymbol{\xi }$ 。