【统计学习｜书籍阅读】第二章感知机 p25-p35

Lydia.na

于 2022-09-26 08:29:15 发布

阅读量214

点赞数

分类专栏：书籍阅读机器学习

本文链接：https://blog.csdn.net/m0_52427832/article/details/127046470

版权

机器学习同时被 2 个专栏收录

10 篇文章 5 订阅

订阅专栏

书籍阅读

6 篇文章 0 订阅

订阅专栏

文章目录

思路
感知机
感知机学习策略
感知机学习算法
- 感知机的原始形式
- 感知机的对偶形式
收敛性

思路

感知器对应于输入空间中将实例划分为正负两类的分离超平面，属于判别模型，感知机学习旨在求出将训练数据进行线性划分的分离超平面。为此，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化，求的感知机模型。感知机学习算法简单易实现，具有原始形式和对偶形式。

感知机

感知机是根据输入实例的特征向量 $x$ 对其进行二分类的线性分类模型：
$f (x) = s i g n (w * x + b)$ 感知器模型对应于输入空间（特征空间）中的分离超平面 $w * x + b = 0$

感知机学习策略

感知器的学习策略是极小化损失函数： $\min_{w,b}L(w,b)=-\sum_{x_j\subseteq M}y_i(w*x_i+b)$
损失函数对应于误分类点到分类超平面的总距离。

感知机学习算法

感知机学习算法是基于随机梯度下降法的对损失函数的最优化算法，有原始形式和对偶形式。原始算法中，首先任意选取一个超平面，然后用梯度下降法不断极小化目标函数，在这个过程中一次随机选取一个误分类点使其梯度下降。

感知机的原始形式

原始形式和对偶形式的区别就是损失函数的梯度不同。

感知器模型： $f (x) = s i g n (w * x + b)$
损失函数的梯度： $\bigtriangledown _wL(w,b)=-\sum_{x_j\subseteq M}y_i*x_i$
$\bigtriangledown _bL(w,b)=-\sum_{x_j\subseteq M}y_i$
w,b更新方式： $w\gets w+\eta y_ix_i$
$b\gets b+\eta y_i$

感知机的对偶形式

对偶形式的基本思想是将w和b表示为实例xi和标记yi的线性组合的形式，通过求解系数而得到w和b.
感知机模型： $f(x)=sign(\sum_{j=1}^{N} \alpha _iy_ix_i*x+b)$
学习到的w,b:
$w=\sum_{i=1}^{N}\alpha _iy_ix_i$
$b=\sum_{i=1}^{N}\alpha _iy_i$
更新方式：
$\alpha _i\gets \alpha _i+\eta$
$b\gets b+\eta y_i$