【统计学习方法】第二章感知机

最新推荐文章于 2021-01-31 16:52:04 发布

aaon22357

最新推荐文章于 2021-01-31 16:52:04 发布

阅读量163

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/aaon22357/article/details/90211538

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章目录

基础概念
- 数据集的线性可分性
- 点到平面的距离
第二章感知机

基础概念

数据集的线性可分性

对于给定数据集，如果存在某个超平面 $w \cdot x + b = 0$ ，能够将数据集的正类和负类样本点完全正确划分，则称该数据集线性可分。

点到平面的距离

空间中任一点到超平面S的距离是：（平面S方程为 $w \cdot x + b = 0$ ）
在这里插入图片描述
（推导见 https://blog.csdn.net/yutao03081/article/details/76652943）

第二章感知机

感知机是二分类的线性分类模型，属于判别模型。目的是学习一个超平面，对数据进行线性划分，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化，可求得感知机模型。

1.感知机模型

线性方程 $w \cdot x + b = 0$ ，对ing与特征空间中的一个超平面S，这个超平面将空间划分为正、负两部分，S称为分离超平面。
在这里插入图片描述
我们要做的就是，学习参数w和b，得到感知机模型。

2.感知机学习策略

感知机模型的优化策略是：使得误分类点到超平面的距离总和最小，对于误分类点 $x_i$ ，有： $y_i(w·x_i+b) > 0$
因此，误分类点 $x_i$ 到超平面的距离为： $-\frac{1}{||w||}y_i(w·x_i+b)$
假设所有误分类点集合为M，则所有误分类点到S的总距离为：
$-\frac{1}{||w||}\sum_{x_i\in{M}}y_i(w·x_i+b)$

感知机的损失函数定义为：(M为误分类点的集合)（注意：这里的损失函数是经验风险函数）
$L(w,b)=-\sum_{x_i\in{M}}y_i(w·x_i+b)$
感知机模型就是通过学习，使得上述损失最小。

3.感知机学习算法

采用随机梯度下降来学习，更新的时候随机选取一个误分类点 $x_i$ ，让其梯度下降（不是一次使所有误分类点的梯度都下降）。损失函数 $L (w, b)$ 的梯度为：
$\nabla_wL(w,b)=-\sum_{x_i\in{M}}y_ix_i$
$\Delta_L(w,b)=-\sum_{x_i\in{M}}y_i$
随机选取一个误分类点 $x_i$ ，对w，b进行更新：
$\eta{y_ix_i}$
$\eta{y_i}$
在这里插入图片描述
感知机算法的收敛性：

对于线性可分数据集，感知机算法原始形式收敛，即经过有限次迭代可以得到一个将训练数据集完全正确划分的分离超平面及感知机模型。

aaon22357

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【统计学习方法】第二章感知机

文章目录基础概念数据集的线性可分性点到平面的距离第二章感知机1.感知机模型2.感知机学习策略3.感知机学习算法基础概念数据集的线性可分性对于给定数据集，如果存在某个超平面 w⋅x+b=0w·x+b=0w⋅x+b=0，能够将数据集的正类和负类样本点完全正确划分，则称该数据集线性可分。点到平面的距离空间中任一点到超平面S的距离是：（平面S方程为w⋅x+b=0w·x+b=0w⋅x+b=0）...
复制链接

扫一扫