感知机 —— 算法（对偶形式）

最新推荐文章于 2024-02-18 11:00:00 发布

迷途无归

最新推荐文章于 2024-02-18 11:00:00 发布

阅读量1.3k

点赞数

分类专栏：统计学习方法文章标签：感知机感知机对偶形式

本文链接：https://blog.csdn.net/qq_27297393/article/details/99658931

版权

统计学习方法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

算法流程

输入：线性可分的数据集 $\left\{ (x_1,y_1), (x_2,y_2),···,(x_N,y_N)\right\}$ ，其中 $x_i \in\chi=\mathbf{R}^n$ ， $y_i\in Y=\left\{-1,+1\right\},i=1,2,···,N$ ；学习率 $\eta(0<\eta \le1)$ ；
输出： $a, b$ ；感知机模型 $f(x)=sign(\sum_{j=1}^N\alpha_jy_jx_j·x_i+b)$
其中 $a=(a_1,a_2,···a_N)^T$ 。

解的过程：
（1） $a\gets0,b\gets0$ ；
（2）在训练集中选取数据 $x_i,y_j)$
（3）如果 $y_i(w·x_i+b)=y_i(\sum_{j=1}^N\alpha_jy_jx_j·x_i+b)\le0$
则 $a_i \gets a_i+\eta , b \gets b+ \eta y_i$
（4）转至（2）直至没有误分类数据。
注
对偶形式中训练实例仅以内积的形式出现。为了方便，可以预先将训练集中实例间的内积计算出来并以矩阵的形式存储，这个矩阵就是所谓的Gram矩阵
$G=[x_i·x_j]_{N*N} = \begin{bmatrix} <x_1·x_1> \quad <x_1·x_2> \quad ··· \quad <x_1·x_n> \\ <x_2·x_1> \quad <x_2·x_2> \quad ··· \quad <x_2·x_n> \\ · \quad \quad\quad\quad\quad\quad· \quad\quad\quad ··· \quad\quad\quad\quad · \\ · \quad \quad\quad\quad\quad\quad· \quad\quad\quad ··· \quad\quad\quad\quad · \\ · \quad \quad\quad\quad\quad\quad· \quad\quad\quad ··· \quad\quad\quad\quad · \\ <x_n·x_1> \quad <x_n·x_2> \quad ··· \quad <x_n·x_n> \end{bmatrix}$

算法示例

例2.2：数据通2.1，其正实例点是 $x_1=(3,3)^T$ ， $x_2=(4,3)^T$ ，其负实例点是 $x_3=(1,1)^T$ ，试用感知机学习算法的对偶形式求感知机模型。

解
（1）取 $a_i=0,i=1,2,3,b=0,\eta=1;$
（2）计算Gram矩阵：
$G=[x_i·x_j]_{N*N} = \begin{bmatrix} <x_1·x_1> \quad <x_1·x_2> \quad <x_1·x_3> \\ <x_2·x_1> \quad <x_2·x_2> \quad <x_2·x_3> \\ <x_3·x_1> \quad <x_3·x_2> \quad <x_3·x_n> \end{bmatrix}= \begin{bmatrix} 3*3+3*3 \quad 3*4+3*3 \quad 3*1+3*1 \\ 4*3+3*3 \quad 4*4+3+3 \quad 4*1+3*1 \\ 1*3+1*3 \quad 1*3+1*3 \quad 1*1+1*1 \end{bmatrix}= \begin{bmatrix} 18 \quad 21 \quad 6 \\ 21 \quad 25 \quad 7 \\ 6 \quad 7 \quad 2 \end{bmatrix}$
（3）误分条件 $y_i(w·x_i+b)=y_i(\sum_{j=1}^N\alpha_jy_jx_j·x_i+b)\le0$
更新参数 $a_i \gets a_i+1 , b \gets b+ y_i$
（4）迭代。过程从略见表

$k$	0	1	2	3	4	5	6	7
		$x_1$	$x_3$	$x_3$	$x_3$	$x_1$	$x_3$	$x_3$
$a_1$	0	1	1	1	1	2	2	2
$a_2$	0	0	0	0	0	0	0	0
$a_3$	0	0	1	2	3	3	4	5
$b$	0	1	0	-1	-2	-1	-2	-3

（5） $w=2x_1+0x_2-5x_3=(1,1)^T$
$b = - 3$
分离超平面
$x^{(1)}+x^{(2)}-3=0$
感知机模型
$f(x)=sign(x^{(1)}+x^{(2)}-3)$

注：
与原始形式一样，感知机学习算法的对偶形式迭代是收敛的，存在多个解。

迷途无归

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
感知机 —— 算法（对偶形式）

算法流程输入：线性可分的数据集T={(x1,y1),(x2,y2),⋅⋅⋅,(xN,yN)}T= \left\{ (x_1,y_1), (x_2,y_2),···,(x_N,y_N)\right\}T={(x1,y1),(x2,y2),⋅⋅⋅,(xN,yN)}，其中xi∈χ=Rnx_i \in\chi=\mathbf{R}^nxi∈χ=Rn，yi∈Y={−1,+1},i=1,2,⋅...
复制链接

扫一扫