统计机器学习笔记(一)：感知机

最新推荐文章于 2022-05-26 15:28:19 发布

tongchaun1999

最新推荐文章于 2022-05-26 15:28:19 发布

阅读量343

点赞数

分类专栏：统计学习方法文章标签：机器学习算法

本文链接：https://blog.csdn.net/qq_39622197/article/details/114445520

版权

统计学习方法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

 **perceptron:感知机，二分类的线性分类模型。**
 从输入的特征向量判定类别，向量-->{-1,1},目的是为了求出将数据进行线性划分的分离超平面。
模型特点：线性，判别。

在这里插入图片描述

数据的线性可分：存在一个超平面S，使得所有yi=1的f(xi)>0，所有yi=-1的f(xi)<0,则称数据为线性可分。

学习策略：(损失函数的选择)首先想到的是误分类点的个数，但是这个不能表示为参数的可微函数，不容易优化，因此选择的损失函数为**误分类点到感知机S的距离。***
对于误分类点：有-yi(wxi+b)>0

因此，将样本点的函数间隔定义为感知机的损失函数。

感知机算法的原始形式：
W=-∑_(xi∈m)xiyi b=-∑_(xi∈m)yi
M为所有误分类点的集合。在误分类时是w与b的可导线性函数，在没有误分类时为0。
minL(w,b)：选取任意超平面(w0,b0),然后随机选取误分类点(xi,yi),更新w=w+lrxiyi，b=b+lryi。通过不断迭代使得损失函数L减小至零。lr∈[0,1]，yi为-1或者1.
不是一次使所有误分类点的梯度下降，而是随机选取一个误分类点使其梯度下降。
感知机初值选取与迭代顺序不同，最后获得的超平面也不同。

误分类的次数k是有上界的。 在这里插入图片描述