PLA感知机

love2study

于 2022-04-11 09:48:51 发布

阅读量107

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/m0_64881386/article/details/124091905

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

PLA感知机

基本原理

输入特征向量x，有n个特征，每个特征有 $w_i(1<=i<=n)$ ,即输出为 $w^Tx$ ,若大于阈值，则输出1，小于阈值，则输出-1。若阈值设为 $w_0$

模型表达式 $h(x)=sign(\sum_{i=1}^{n}w_ix_i-w_0)=sign(\sum_{i=1}^{n}w_ix_i-w_0(1))=sign(\sum_{i=0}^{n}w_ix_i)$

Perceptron Learning Algorithm

基本思想：数据集可以被线性可分，先选取初始的系数 $w_0$ ,先选取第一个错误的点，对参数进行更新，即 $w_{t+1}=w_t+y_{i(t)}x_{i(t)}$ 。更新后，再选取第二个，第三个错误的点，直到所有的点都被修正后，就得到最好的直线。这种“逐步修正”，就是PLA的思想所在。

$x_{i(t)}$ 第t次修正下， $x_i$ 的值,且其值为列向量

更正原理：如果一个点为正的，即y为1，而错误的分类为负的，对这个点进行修正。对于此点： $w_{i(t)}^Tx_{i(t)}<0(0<=i<=n)$ ,由于点乘内积关系，即向量 $w_i$ 与向量 $x_i$ 相差大于90度，而对于直线 $y=w_ix$ 来说， $w_i$ 是直线y的法向量，则，点 $x_i$ 被误分为直线的下方，经过一次或几次参数更新 $w_{t+1}=w_t+y_{i(t)}x_{i(t)}$ 后，使得分类错误的点得到修正。

在这里插入图片描述

$w_{t+1}=w_t+y_{i(t)}x_{i(t)}$ 是向量的加法

错误分类成正的，也同理，因为y变成了-1

Guarantee of PLA

PLA只会在线性可分的情况下停止更新，在非线性可分的情况下不会停止。

有限次数更新原理：

如果有一条直线可以线性可分，此时参数为 $w_f$ ，则 $y_{i(t)}w_{f(t)}^Tx_{i(t)}>=min_ny_nw_{f(t)}^Tx_{n(t)}>0$

PLA中 $w_f^Tw_{t+1}$ 越来越大，就表示两者在接近，证明PLA是有学习效果的

$w_f^Tw_{t+1} = w_f^T(w_{t}+y_{n(t)}x_{n(t)})>=w_f^Tw_{t}+min_ny_nw_{f(t)}^Tx_{n(t)} >w_f^Tw_{t}+0$

但是也有可能是由于模变长了，故而证明 $w_{t+1}$ 和 $w_t$ 的模关系

$w_{t+1}||^{2} = ||w_t+y_{i(t)}x_{i(t)}|| = ||w_t||^2+2y_{n(t)}w_t^Tx_{n(t)}+||y_{n(t)}x_{n(t)}||^2<=||w_t||^2+max_{n}||y_nx_n||^2$

故而增量是有限的，向量的长度差别不会太大

设初始权重为 $w_0$ ，经过T次修改后，有如下结论：
在这里插入图片描述

即PLA会停止下来，（T）有上界。

Non-Separable Data

但是在实际中，是很难完全，线性可分的，有部分噪声点，故更新公式为

$w_{t+1}=argmax_w\sum_{i=1}^{n}{y_n≠sign(w^Tx_n)}$

修改后的PLA被称为Packet Algorithm，与PLA基本类似。相处时化 $w_0$ ，在逐个点更新，更新w时，得到一条新的直线，在计算其对应的分类错误点时，与之前错误点个数相比，谁少取谁。

love2study

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
PLA感知机

PLA感知机基本原理输入特征向量x，有n个特征，每个特征有wi(1<=i<=n)w_i(1<=i<=n)wi(1<=i<=n),即输出为wTxw^TxwTx,若大于阈值，则输出1，小于阈值，则输出-1。若阈值设为w0w_0w0模型表达式h(x)=sign(∑i=1nwixi−w0)=sign(∑i=1nwixi−w0(1))=sign(∑i=0nwixi)h(x)=sign(\sum_{i=1}^{n}w_ix_i-w_0)=sign(\sum_{i=1}^{n
复制链接

扫一扫