线性可分支持向量机最大间隔唯一性证明

最新推荐文章于 2021-03-29 21:54:28 发布

子秦1117

最新推荐文章于 2021-03-29 21:54:28 发布

阅读量1.5k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sunspeedzy/article/details/79988143

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

线性可分支持向量机最大间隔唯一性证明

《统计学习方法》定理7.1中唯一性的证明：

假设问题(7.13)~(7.14)存在两个最优解( $w^*_1, b^*_1$ )和( $w^*_2, b^*_2$ )，则 $w^*_1和w^*_2$ 的长度相同，即 $||w^*_1||=||w^*_2||=c$ ，其中c是一个常数。令 $w=\dfrac{w^*_1+w^*_2}{2}$ ， $b=\dfrac{b^*_1+b^*_2}{2}$ ，将( $w^*_1, b^*_1$ )和( $w^*_2, b^*_2$ )分别带入到式(7.14) $y_i(w\cdot x_i+b)-1 \gt=0$ ，有 $y_i(w^*_1\cdot x_i+b^*_1)-1 \gt=0$ 和 $y_i(w^*_2\cdot x_i+b^*_2)-1 \gt=0$ ，
两式相加除以2，就有 $y_i(\dfrac{w^*_1+w^*_2}{2}\cdot x_i+\dfrac{b^*_1+b^*_2}{2})-1 \gt=0$ 。所以，(w, b)是问题(7.13)~(7.14)的可行解，从而有

c \leq | | w | | \leq 1 2 | | w * 1 | | + 1 2 | | w * 2 | | = c

$c\le ||w||\le \dfrac{1}{2}||w^*_1||+\dfrac{1}{2}||w^*_2||=c$
上式表明，

||w||=12||w∗1||+12||w∗2||=c | | w | | = 1 2 | | w 1 ∗ | | + 1 2 | | w 2 ∗ | | = c $||w||= \dfrac{1}{2}||w^*_1||+\dfrac{1}{2}||w^*_2||=c$ ，如果有

w∗1=λw∗2 w 1 ∗ = λ w 2 ∗ $w^*_1=\lambda w^*_2$ ，则式

||w||=12||w∗1||+12||w∗2|| | | w | | = 1 2 | | w 1 ∗ | | + 1 2 | | w 2 ∗ | | $||w||= \dfrac{1}{2}||w^*_1||+\dfrac{1}{2}||w^*_2||$ 会等价于

|λ+1|⋅||w∗2||2=|λ|2||w∗2||+12||w∗2|| | λ + 1 | ⋅ | | w 2 ∗ | | 2 = | λ | 2 | | w 2 ∗ | | + 1 2 | | w 2 ∗ | | $\dfrac{|\lambda+1| \cdot ||w^*_2||}{2}= \dfrac{|\lambda|}{2}||w^*_2||+\dfrac{1}{2}||w^*_2||$ ，又因为

w∗1和w∗2 w 1 ∗ 和 w 2 ∗ $w^*_1和w^*_2$ 要满足式(7.13)使

||w||2 | | w | | 2 $||w||^2$ 最小，所以

λ=1 λ = 1 $\lambda=1$ ，即

w∗1=w∗2 w 1 ∗ = w 2 ∗ $w^*_1=w^*_2$ 。
由此两个最优解(

w∗1,b∗1 w 1 ∗ , b 1 ∗ $w^*_1, b^*_1$ )和(

w∗2,b∗2 w 2 ∗ , b 2 ∗ $w^*_2, b^*_2$ )可以写为(

w∗,b∗1 w ∗ , b 1 ∗ $w^*, b^*_1$ )和(

w∗,b∗2 w ∗ , b 2 ∗ $w^*, b^*_2$ )。

再证 $b^*_1=b^*_2$ ：
设 $x'_1和x'_2$ 是集合 $\{x_i|y_i=+1\}$ 中分别对应于( $w^*, b^*_1$ )和( $w^*, b^*_2$ )使得问题(7.14)的不等式等号成立的点， $x''_1和x''_2$ 是集合 $\{x_i|y_i=-1\}$ 中分别对应于( $w^*, b^*_1$ )和( $w^*, b^*_2$ )使得问题(7.14)的不等式等号成立的点，则有方程组
(1) $1 \cdot (w^*\cdot x'_1+b_1)-1 = 0$
(2) $1 \cdot (w^*\cdot x'_2+b_2)-1 = 0$
(3) $(-1) \cdot (w^*\cdot x''_1+b_1)-1 = 0$
(4) $(-1) \cdot (w^*\cdot x''_2+b_2)-1 = 0$
(1)-(3)，得到 $b_1=\dfrac{1}{2}(w^* \cdot x'_1+w^* \cdot x''_1)$
(2)-(4)，得到 $b_2=\dfrac{1}{2}(w^* \cdot x'_2+w^* \cdot x''_2)$
两式相减，得

b * 1 - b * 2 = - 1 2 [w * \cdot (x' 1 - x' 2) + w * \cdot (x'' 1 - x'' 2)]

$b^*_1-b^*_2=-\dfrac{1}{2}[w^* \cdot (x'_1-x'_2)+w^* \cdot (x''_1-x''_2)]$
又因为

(w∗⋅x′2+b1)>=1=(w∗⋅x′1+b1) ( w ∗ ⋅ x 2 ′ + b 1 ) >= 1 = ( w ∗ ⋅ x 1 ′ + b 1 ) $(w^*\cdot x'_2+b_1) >=1 = (w^*\cdot x'_1+b_1)$ 和

(w∗⋅x′1+b2)>=1=(w∗⋅x′2+b2) ( w ∗ ⋅ x 1 ′ + b 2 ) >= 1 = ( w ∗ ⋅ x 2 ′ + b 2 ) $(w^*\cdot x'_1+b_2) >=1 = (w^*\cdot x'_2+b_2)$ ，所以有

w∗(x′2−x′1)>=0 w ∗ ( x 2 ′ − x 1 ′ ) >= 0 $w^*(x'_2-x'_1)>=0$ 和

w∗(x′1−x′2)>=0 w ∗ ( x 1 ′ − x 2 ′ ) >= 0 $w^*(x'_1-x'_2)>=0$ ，则

w∗(x′1−x′2)=0 w ∗ ( x 1 ′ − x 2 ′ ) = 0 $w^*(x'_1-x'_2)=0$ 。同理有

w∗(x′′1−x′′2)=0 w ∗ ( x 1 ″ − x 2 ″ ) = 0 $w^*(x''_1-x''_2)=0$
因此，

b∗1−b∗2=0 b 1 ∗ − b 2 ∗ = 0 $b^*_1-b^*_2=0$ ，即

b∗1=b∗2 b 1 ∗ = b 2 ∗ $b^*_1 = b^*_2$ 。
所以最优解是唯一的。

子秦1117

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
线性可分支持向量机最大间隔唯一性证明

线性可分支持向量机最大间隔唯一性证明《统计学习方法》定理7.1中唯一性的证明：假设问题(7.13)~(7.14)存在两个最优解(w∗1,b∗1w1∗,b1∗w^*_1, b^*_1)和(w∗2,b∗2w2∗,b2∗w^*_2, b^*_2)，则 w∗1和w∗2w1∗和w2∗w^*_1和w^*_2的长度相同，即 ||w∗1||=||w∗2||=c||w1∗||=||w2∗||=c||w^*...
复制链接

扫一扫