统计学习方法——感知机(自学笔记)

本文详细介绍了感知机模型,这是一个用于二类分类的线性模型,通过寻找最佳超平面进行实例划分。感知机利用梯度下降法优化损失函数,确保误分类点到超平面的距离最小。内容涵盖了线性可分性、函数间隔与几何间隔的概念,并讨论了算法的收敛性。此外,文章还提及了感知机的学习策略和更新规则,包括原始形式和对偶形式的算法。
摘要由CSDN通过智能技术生成

感知机是二类分类的线性分类模型。

输入——实例特征向量;

输出——实例类别,取+1,-1二值。

用于求误分类的损失最小化,利用了梯度下降法

定义如下图

感知机模型如下图:

感知机模型用于二分类,从图来理解定义就是wx+b=0这条直线将实例分为两个部分,这里用来sign函数,取值±1.

wx+b构成了超平面,也可以这么理解2d——线;3d——面

感知机的学习策略

线性可分性 

也就是说能正确分在超平面两侧就是线性可分,不能就线性不可分。

函数间隔与几何间隔

判断模型好坏用的是损失函数:误分类点到超平面的距离 

函数间隔:

|w*x_{0}+b|

几何间距(一般用):

\frac{1}{||w||}|w*x_{0}+b|

||w||_{2}=\sqrt{\sum_{i=1}^{N} w_{i}^{2}}

对误分类的数据来说

误分类点到超平面S的距离为:

 因此所有误分类点到超平面S总距离为

 算法过程:     1、任意选取超平面w_{0},b_{0}

                        2、采用梯度下降法极小化目标函数

                         3、更新w,b

算法1:原始形式

 算法2:对偶形式

 

 算法的收敛性

 

 

定理表明,误分的次数k是有上限的。

(收敛的推导视频可以看b站up主一只摩萨耶)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值