[统计学习方法]感知机

本文介绍了感知机模型,用于二元分类问题,特别是其线性可分性的概念。感知机通过寻找超平面进行分类,并利用随机梯度下降法优化损失函数以寻找最佳参数。讨论了算法的收敛性和学习过程中的对偶形式,强调了在线性可分数据集上的应用。
摘要由CSDN通过智能技术生成

1.感知机模型

其中w和b为感知机模型的参数,w为权值向量,b为偏置,sign为符号函数,当x大于等于0时,sign(x)=+1,否则sign(x)=-1。

感知器模型是用来解决二元分类的模型,即输入是特征向量,输出是类别(取+1和-1两个值),例如,给定银行客户的基本信息(性别,年龄,年薪等等,称为特征向量),输出为是否发信用卡(是:+1,否:-1),或者是判别一封邮件是否是垃圾邮件等等。

感知机模型是一种线性分类的模型,在几何中可以想象成一个特征空间Rn的一个超平面S,w为法向量,b为截距,这个超平面将特征空间划分成两部分,这两部分分别表示正的结果和负的结果。

如果说得比较通俗的话,就是寻找一个函数


使得对于所有的已知数据(x,y),当y为+1的时候,该函数的取值都大于等于0,y为-1时,该函数的取值都小于0。

这里,我们需要确定的值有w1~wn和b。

PS:在这里我们可以在每个数据中加入个x0=1,使得函数变成


其中w0=b,这么做的好处是可以把b和w统一起来一起计算,且f(x)就可以直接记成两个向量w和x的内积,当然本书没有这么处理,就先不怎么处理吧。

2.数据集的线性可分性

如果真的存在这么个f(x),使得对于所有数据,y=+1时f(x)>=0,y=-1时f(x)<0的话,那

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值