感知机学习算法解析-CSDN博客

本文链接：https://blog.csdn.net/encoding_utf_8/article/details/102492841

线性分类模型之感知机

已知线性可分数据： Data = { ${(X_{i},y_i)}$ } 其中 (i = 1,2,…,N)；N个样本，p个特征。
假设数据线性可分：如图。
设 D = {被错误分类的样本}

$\boxed{f(x) = Sign(w^Tx) ,x\in R^p,w\in R^p,其中Sign(a) = \begin{cases}1&a\geqslant0\\-1&a<0\end{cases}}$

思路一：我们使用被错误分类的点的个数为loss function:
$\boxed{L(w) = \sum\limits_{i=1}^NI\{y_i w^T<0\}}$
由于这个loss function 不可导，不方便对它进行优化，所以我们采用思路二。

思路二：我们发现 ${-\sum\limits_{i=1}^Ny_iw^T}$ 刚好可以作为loss function
$-\sum\limits_{x_i\in D}^Ny_iw^T}$ ,这个loss function 刚好是可导而且可以完成分类任务。

想想为什么？ $\boxed{L(w) = -\sum\limits_{x_i\in D}^Ny_iw^T}$ 表示错误的点到平面的距离和。

$\boxed{W^{(t+1)} \longleftarrow W^{(t)} - \lambda\nabla (L)}$
其中， ${\lambda 为步长，\nabla (L) 为梯度，\nabla (L) = -y_ix_i 。}$

例2.1　如图2.2所示的训练数据集，其正实例点是x1＝(3,3)T，x2＝(4,3)T，负实例点是x3＝(1,1)T，试用感知机学习算法的原始形式求感知机模型f(x)＝sign(w·x+b)。这里，w＝(w(1),w(2))T，x＝(x(1),x(2))T。

在这里插入图片描述

经过一番努力，我们终于完成了感知机的模型与算法推导，希望大家能够自己多多动手，自己总结，能够掌握感知机模型。

参考内容：
1.白板推导之线性分类模型
2.李航《统计学习方法》