《统计学习方法》第二章感知机笔记

最新推荐文章于 2020-11-06 12:59:35 发布

爱吃草莓的西瓜酱

最新推荐文章于 2020-11-06 12:59:35 发布

阅读量184

点赞数 1

分类专栏：机器学习文章标签：感知机

本文链接：https://blog.csdn.net/weixin_41045344/article/details/87986437

版权

11 篇文章 1 订阅

订阅专栏

本文深入解析了感知机模型，它作为二类分类的线性模型，寻找最优决策函数。感知机学习策略是通过最小化经验损失函数，通常采用随机梯度下降法。对于线性可分数据，感知机算法收敛，但面对线性不可分情况时，可能不收敛或产生震荡。此外，还探讨了感知机学习算法的对偶形式及其收敛性。

摘要由CSDN通过智能技术生成

第二章感知机

定义经验损失函数极小化
损失函数的两种选择：
- 误分类点的总数：但该函数不是参数w,b的连续可导函数
- 误分类点到超平面S的总距离：感知机采样该策略，因为该函数不是参数w,b的连续可导函数
  - 上式的系数可去，因为w,b分别乘了个系数之后，变成另一个w1,b1，但我们只是为了求出参数w,b，故可去。
感知机学习的策略是在假设空间中选取使损失函数最小的模型参数w,b ，即感知机模型。

求解最优化问题：
- 随机梯度下降法 vs 批量梯度下降
  - 后者，数据量大，慢
  - 感知机中选用前者，极小化过程一次随机选取一个误分类点使其梯度下降。
损失函数L(w,b)的梯度：

注：上面的两个式子都是正的
对w,b进行更新
感知机学习算法由于采用不同的初值或选取不同的误分类点，解可以不同。
感知机算法存在许多解，既依赖于初值，也依赖迭代过程中误分类点的选择顺序。
为了得到唯一的超平面，需要对分离超平面增加约束条件，即线性支持向量机的想法，——> 间隔最大化。

- 在这里插入图片描述

关注