《统计学习方法》读书笔记——第2章 感知机

总结:感知机是一个二分类线性分类模型,旨在用一个超平面将数据线性划分。

一、模型

感知机使用的函数是:f(X)=sign(w*X+b),sign是符号函数,sign(x)表示如果x>0则为1,x<0则取-1。

几何意义就是一个超平面S,将空间分为两部分,一部分为正、一部分为负

(感知机只适合线性可分的数据集)

二、策略

误分类点到超平面S的距离和作为损失函数(为了方便计算,真正的损失函数做了一些调整)

误分类点到超平面距离:

等价于:

求和,去掉常数项||w||,得到损失函数:

三、算法

1、原始形式

首先任取一个超平面,w0、b0,然后采用梯度下降法不断优化目标函数(使损失函数极小)

损失函数的梯度:

算法步骤:1)选取初值w0、b0

                   2)在训练集中选取数据(xi,yi)

                   3)如果yi(wxi+b)<=0,即该点为误分类点,则进行梯度下降:

                          

                   4)转到(2)直到训练集中没有误分类点

2、对偶形式

由原始形式可以发现,算法主要是在误差点处通过修改w和b的值。

假设误差点修改次数为ni次,那么w,b关于点(xi,yi)的增量分别为aiyixi,aiyi (ai=ni*学习率)

那么:

把w、b用上式带入,就可以得到对偶形式方法。

算法步骤:1)a<-0,b<-0(其中a = (a1,a2....an)T)

                   2)选取点(xi,yi)

                   3)如果,说明是误分类点,则:

                         ai<-ai+学习率

                         b<-bi+学习率

                  4)转至2)直到没有误分类点

由于对偶形式中训练数据仅以内积形式出现,因此可以预先计算出内积并以矩阵形式存储,这就是Gram矩阵

               

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值