统计学习方法笔记(五)感知机算法

感知机

感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1跟-1二值。感知机的学习旨在求出将训练数据进行线性划分的分离超平面
1. 感知机的定义:由输入空间到输入空间的如下函数:
f(x)=sign(wx+b) f ( x ) = s i g n ( w ⋅ x + b )
其中, w w b 为感知机模型参数, w w 叫做权值或权值向量,b 叫做偏置。
感知机解释如下:线性方程 wx+b=0 w ⋅ x + b = 0 对应于特征空间中的一个超平面 S S ,其中 w 是超平面的法向量, b b 是超平面的截距(超平面这个概念不太理解,怎样从方程的形式可以看出对应的几何面是平面),超平面可以将特征向量划分为正负两类,因此,超平面又被称为分离超平面。
2. 学习策略:
1) 数据集的线性可分性:给定一个数据集,存在一个超平面能够将数据集的正负实例点完全正确的划分到超平面的两侧
2) 感知机学习策略:定义损失函数使得损失函数极小化,显然,将损失函数选择为误分类点到超平面的总距离,是比较合适的。
首先写出输入空间中任一点 x0 到超平面的距离:
1w|wx0+b| 1 ‖ w ‖ | w ⋅ x 0 + b |
其中 w ‖ w ‖ 是w的L2范数。推导过程请参考他人 博客http://blog.csdn.net/amyaguang/article/details/46043885
误分类点到超平面的距离是:
1wyi(wx0+b) − 1 ‖ w ‖ y i ( w ⋅ x 0 + b )
所有的误分类点到超平面的总距离为:
1wxiMyi(wx0+b) − 1 ‖ w ‖ ∑ x i ∈ M y i ( w ⋅ x 0 + b )
所以,可以把感知机学习的损失函数定义为:
L(w,b)=xiMyi(wx0+b) L ( w , b ) = − ∑ x i ∈ M y i ( w ⋅ x 0 + b )

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值