李航统计学习——第二章感知机(上)

第一章主要介绍了学习方法的三要素:
模型、策略、算法

这章主要介绍感知机

1 从模型来理解感知机概念

感知机是一个二分类线性分类模型。

无论是机器学习还是深度学习,按着三要素走(模型->策略->算法)
模型本质还是假设空间(Hypothesis Space):所有可能的条件概率分布或决策函数。而假设空间(模型)是由参数空间决定的。

【补】
假设空间是所有可能决策函数的集合;
而每个决策函数由一个参数向量决定;
参数空间:所有可能的参数向量组成的空间

举个例子:线性 y = w T x + b y=w^Tx+b y=wTx+b 这里是由所有的 w , b w,b w,b 构成集合决定的假设空间。
因此,
在这里插入图片描述
在这里插入图片描述
感知机:从输入空间到输出空间的函数,这个函数就称作感知机。

从几何角度来理解感知器
在这里插入图片描述

先科普超平面S:在几何中,如果环境空间是n维的,那么它所对应的超平面其实就是一个n-1 维的子空间。换句话说,超平面是比他所处的环境空间小一个维度的子空间。
举个例子来说明,如果是一个二维平面,那么超平面就是直线;如果是一维平面,超平面则就是实点,以此类推。

为什么需要超平面S?
个人的理解是因为感知器是一个二分类的线性模型,输出空间是一个只包含+1和-1的一个集合,+1是正类,-1是负类; 需要区分正负类,而区分这个正负类就是超平面S的存在。

在这里插入图片描述
红色线,是法向量;绿色这条线,代表的是原点到超平面的距离,我们需要使其距离和最短。

2 学习策略

感知机模型,必要条件是要求数据集必须是线性可分的。
线性可分:对于给定的数据集,如果存在某个超平面,使得这个数据集的所有实例点可以完全划分到超平面的两侧,也就是正类和负类。我们就称这个数据集是线性可分的,否则线性不可分。

策略则需要合理地定义感知机相应的损失函数,如经验风险最小化策略或结构风险最小化策略。
最小化损失函数就是我们学习的策略:
在这里插入图片描述

3 算法

感知机的算法有两种形式:原始形式和对偶形式。

3.1 原始形式

如何求参数w和b,通过寻找使损失函数最小的参数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值