感知机理论+r实现 统计学习方法笔记

本文介绍了感知机模型的概念,包括线性分类模型和分离超平面的定义,并详细阐述了感知机的学习策略,特别是误分类点到超平面的总距离作为损失函数。接着,解释了初始形式的学习算法,以及感知机解的非唯一性。最后,提到了对偶形式的感知机,并提及在R语言中实现感知机模型的可能性。
摘要由CSDN通过智能技术生成

感知机模型

定义:
假设输入空间对应全体实数空间,输出空间对应-1,+1.
由输入空间到输出空间的如下函数:
在这里插入图片描述
称为感知机。w和b为参数。w是全值向量,b叫做偏值。w·x是内积
感知机模型的假设空间是定义在特征空间中的所有线性分类模型。

直观上的理解
感知机 (perceptron) 是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取 +1 和一 值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,线性分类模型,属于判别模型。

超平面:超平面是指 n 维线性空间中维度为 n-1 的子空间,它可以将线性空间分成两个互不相交的两部分

对应于特征空间 Rn 中的一个超平面s,w是超平面的法向量,b是其截距。超平面将特征空间划分为两个部分。位于两部分的点(特征向量)分别被分为正、负两类。因此,超平面被称为分离超平面。
在这里插入图片描述

感知机的学习策略

为了能找出可以将正实例点和负实例点完全分开的超平面,需要制定策略即确定感知机模型参数w,b,需要定义(经验)损失函数并将损失函数极小化。

感知机所采用的损失函数是误分类点到超平面的总距离
首先定义出输入空间中任意一点 x0 到超平面的距离:在这里插入图片描述其中||w||是w的L2范数
其次对于误分类的数据来说, 当 w·xi+b>0 时,yi=-1,。因此,误分类点 Xi 到超平面 的距离是:在这里插入图片描述这样,假设超平面的误分类点集合为 M,那么所有误分类点到超平面 的总距离为:
在这里插入图片描述

·
·
因此定义感知机 sign(w•x+b)的损失函数为:
在这里插入图片描述损失函数时非负的,如果没有误分类点,则损失函数L=0

感知机学习算法

初始形式

定义学习率,即步长η∈(0,1]。初始值为1. 输出:w,b。感知机模型:fx=sign(w·x+b) 。

···1.选取初值w0,b0(任意一个超平面)
···2. 随机选取一个点,若

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值