感知机核心算法的两种理解!

一.感知机模型

  • f(x)=sign(wx+b)

    感知机是一种线性分类模型,属于判别模型.
    

二. 感知机学习策略

  • 损失函数

    L(w,b)=xiMyi(wxi+b)

    • yi(wxi+b) 表示点 (xi,yi) 到分割超平面 y=wx+b 的函数距离
    • M为误分类点的集合
  • 核心思想1:感知机的损失函数也就是所有误分类点到分割超平面的函数距离的总和.因为一个特定样本点的函数距离,误分类时是w,b的线性函数,所以,感知机的损失函数也就是w,b的连续可导的线性函数,有了这个关于参数的线性函数,就可以通过样本点来做优化.

三:感知机学习算法

    这是本文的重点,从两个角度解释感知机学习算法!

1.几何方法

几何角度解释感知机学习算法

    这个图片能很好的解释PLA的学习算法,右图的两个向量就说明了,
    每次碰到错误的分类点,更新w使用的公式(w+yi*xi)的原因.具体看这篇博文:
    http://www.cnblogs.com/HappyAngel/p/3456762.html

2.代数方法

我也是看了上面的博文才提出的问题.这里的代数方法就是正向思维来解释作者的问题
博文中提到:
"那么为什么要这样校正?因为这样可以保证Wt越来越靠近perfect直线Wf(ps.暂时没想到正向思维是如何得到这个式子的)"

核心思想2上面的核心思想1已经说明了PLA的损失函数.

L(w,b)=xiMyi(wxi+b)

他是 所有误分类点到分割超平面的函数距离之和,而且,这个损失函数还是一个 连续可导函数,因此,最小化这个损失函数可以通过 每次选取一个误分类点,使损失函数梯度下降,最终达到最小,这样也就是 yi(wxi+b) 求梯度(这里的b即上面链接博文中的w0),而这里的梯度值正是 yixi ,因此 wt 的校正公式为: wt+1=wt+yixi

这里的核心思想参考李航博士的<<统计学习方法>>第二章的内容!

author by: zxf
作者所有其他博文链接

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值