感知机

orion_t

于 2018-11-01 10:33:46 发布

阅读量179

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/orion_t/article/details/83616352

版权

感知机是二分类的线性模型，适用于线性可分数据集。它通过找到一个超平面进行分类，利用随机梯度下降法更新权重和偏置以最小化损失函数。在训练数据线性可分的情况下，感知机算法会收敛，否则可能产生震荡。对偶形式的感知机以Gram矩阵的形式存储实例内积，同样保证了收敛性。

摘要由CSDN通过智能技术生成

概述

感知机是二分类的线性分类模型，属于判别模型。输入为特征向量，输出为{+1, -1}。

仅能用于线性可分数据集，模型为分离超平面。

采用梯度下降法对损失函数进行极小化。

分为原始形式和对偶形式。

模型

感知机定义：假设特征空间为 $\mathcal{X} \subseteq \mathbf{R}^n$ ，输出空间为 $\mathcal{Y}=\{+1,-1\}$ 。输入 $\bm{x}\in\mathcal{X}$ 表示实例的特征向量，对应于特征空间中的点，输出 $y\in\mathcal{Y}$ 表示实例的类别。由特征空间到输出空间的如下函数
$f(\bm{x}) = {\rm sign}(\bm{w}\cdot\bm{x} + b)$
称为感知机。其中， $\bm{w}$ 和 $b$ 为感知机的模型参数， $\bm{w}\in\mathbf{R}^n$ 为权值向量（weight）， $b\in \mathbf{R}$ 为偏置（bias）， $\bm{w}\cdot\bm{x}$ 为向量内积， ${\rm sign}$ 是符号函数：
${\rm sign}(x) = \begin{cases} +1, & x \geq 0 \\\\ -1, & x < 0 \end{cases}$

感知机的假设空间是定义在特征空间中的所有线性分类模型，即函数集合 $\{f|f(\bm{x})=\bm{w}\cdot\bm{x} + b\}$ 。感知机学习即选择参数 $\bm{w}$ 和 $b$ ，使得损失最小。

几何解释

线性方程 $\bm{w}\cdot\bm{x} + b = 0$ 对应于特征空间 $\mathbf{R}^n$ 中的一个超平面，其中 $\bm{w}$ 是超平面的法向量， $b$ 是超平面的截距。该超平面将特征空间分为两部分，位于两部分的特征向量分别为正类和负类。

策略

数据集必须是线性可分的，即必须存在某个超平面 $\bm{w}\cdot\bm{x}+b=0$ ，使得数据集的正实例点和负实例点完全正确地划分到超平面的两侧（即对所有正例，有 $\bm{w}\cdot\bm{x}+b>0$ ；对所有负例，有 $\bm{w}\cdot\bm{x}+b<0$ ）。