机器学习----感知机,Perceptron Learning Algorithm (PLA)

最新推荐文章于 2021-06-29 21:25:58 发布

zzmsari

最新推荐文章于 2021-06-29 21:25:58 发布

阅读量272

点赞数 1

分类专栏：机器学习文章标签：机器学习感知机 perceptron learning algorithm

本文链接：https://blog.csdn.net/zzmxgd/article/details/102574539

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

机器学习----感知机,Perceptron Learning Algorithm (PLA)

感知机是一种简单、靠谱的分类算法,首先我们看一张示意图：

目标函数：
$h(x)=\text {sign}((\sum_{i=1}^{d}w_ix_i)+b)$

在这里插入图片描述

对于 $（ + 1 ， - 1 ）$ 的分类，如果是 $（ + 1 ， 0 ）$ ，只需要适当调整 $s i g n$ 函数表达式就行了。实际上分错分对都是按上述进行更新的，直到没有错误。由向量关系可知， $w$ 为分类直线的法向量，上图右边表示当 $y = + 1$ 时和 $y = - 1$ 时，分类直线法向量的更新步骤可以看出：

当 $y = + 1$ 分类错误时， $w_t^Tx<0，sign(w_{t+1}^Tx)=-1$ ,两个向量夹角大于90°，更新后向量夹角小于90°， $w_{t+1}^Tx>0，sign(w_{t+1}^Tx)=+1$ ，此点更新后分类正确
当 $y = - 1$ 分类错误时， $w_t^Tx>0，sign(w_{t+1}^Tx)=+1$ ,两个向量夹角小于90°，更新后向量夹角大于90°， $w_{t+1}^Tx<0，sign(w_{t+1}^Tx)=-1$ ，此点更新后分类正确

理论证明：

这里感知机模型为：
$h(x)=\text {sign}((\sum_{i=1}^{d}w_ix_i)+b)$
变形为:
$h(x)=\text {sign}((\sum_{i=0}^{d}w_ix_i))=\text {sign}(w^T(t)x(t))$
接着给出式
$对于y(t) {sign}(w^T(t)x(t))的数据, 更新规则是 w(t + 1) = w(t) + y(t)x(t)$

因为 $y(t)\ne \text {sign}(w^T(t)x(t))$ ，所以当 $\text {sign}(w^T(t)x(t))>0$ 时， $y (t) = - 1$ ，
当 $\text {sign}(w^T(t)x(t))<0$ 时， $y (t) = 1$ ，所以 $y(t)w^T(t)x(t) < 0$
如果分类正确则， $y(t)w^T(t)x(t) > 0$

$y(t)w^T(t+1)x(t)=y(t)(w(t) + y(t)x(t))x(t)=y(t)w^T(t)x(t)+y^2(t)x^T(t)x(t)$
注意 $x (t)$ 的第一个分量为 $1$ , $w (t)$ 第一个分量为截距 $b$ ，因为 $y^2(t)x^T(t)x(t)>0$ ，因此
$y(t)w^T(t+1)x(t)>y(t)w^T(t)x(t)$

由上我们知道，即使分类错误， $y(t)w^T(t)x(t) < 0$ ，但利用更新规则后， $y(t)w^T(t+1)x(t)>y(t)w^T(t)x(t)$ ，也就是向着正方向前进了，即判断的正确率越来越高，所以如果资料是可分的，那么经过有限步之后可以得到 $w$ ，使得对所有的 $x$ ， $yw^Tx>0$