第2章感知机

最新推荐文章于 2023-05-26 14:37:13 发布

ruidajin

最新推荐文章于 2023-05-26 14:37:13 发布

阅读量104

点赞数

分类专栏：统计学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39412443/article/details/114872788

版权

统计学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

小知识

概率模型：通过计算样本关于各个类的后验概率或似然概率，选取概率最大的那个类

判别模型：通过学习分离超平面的系数，将各类分开

判别模型计算条件概率。生成模型计算联合概率

感知机学习策略

介绍：感知机是一个线性分类模型，分离超平面是一个线性方程，学习这个线性函数的系数。

应用场景限制：线性可分数据集，包括后面的收敛性证明也依赖这个假设

学习策略：损失函数最小化

感知机损失函数

损失函数的直观反映是误分类的样本个数，但是需要连续可导函数，才能进行下一步的优化。所以使用误分类样本到分类超平面的距离之和作为损失函数。 $-\frac{1}{||w||}\sum_{x_{i}\in M}y_{i}(wx_{i}+b)$ 简化后得到 $min_{w,b}L(w,b)=-\sum_{x_{i}\in M}y_{i}(wx_{i}+b)$

感知机算法原始形式

参数更新
$\triangledown _{w}L(w,b)=-\sum_{x_{i}\in M}y_{i}x_{i}$ $\triangledown _{b}L(w,b)=-\sum_{x_{i}\in M}y_{i}$
随机选取一个误差分类点进行梯度下降
$w\leftarrow w+\eta y_{i}x_{i}$ $b\leftarrow b+\eta y_{i}$
采用不同的初值和不同的误分类点，解可以不同

离分类超平面近的点学习的次数更多，因为这些点是很难分辨的。

感知机算法收敛性

算法收敛性：在有限次搜索中找到分离超平面

【空位，下次复习手推补上】

用到了线性可分作为条件假设，当线性不可分时，感知机学习算法不收敛，迭代结果会发生震荡

感知机算法对偶形式

对偶形式的思想：在参数w，b更新的过程中就是不断将样本值的组合加到原参数上面。所以可以将参数表示为样本数据的线性组合的形式，通过学习该线性组合的系数，就可以把参数求出来。

【空位，下次复习手推补上】

算法加速的点是可以先把样本之间的内积提前算好存储为Gram矩阵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
第2章感知机

感知机小知识感知机学习策略感知机损失函数感知机算法原始形式感小知识感知机学习策略感知机损失函数感知机算法原始形式感
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。