机器学习：感知机

最新推荐文章于 2024-03-07 21:40:44 发布

番茄要去皮

最新推荐文章于 2024-03-07 21:40:44 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习文章标签：多层感知机机器学习

本文链接：https://blog.csdn.net/weixin_44766179/article/details/89603878

版权

本文介绍了感知机模型，作为二分类的线性分类模型，以及其在机器学习中的应用。接着详细阐述了多层感知机（MLP）的结构和反向传播（BP）算法，特别是激活函数、损失函数以及反向传播过程中的残差传递。通过理解这些概念，有助于深入学习神经网络的工作原理。

摘要由CSDN通过智能技术生成

感知机是二分类的线性分类模型，其输入是样本的特征向量，输出是样本的类别。感知机对应于输入空间中将样本划分为两个类别，属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面，为此，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化，求得感知机模型。
1、感知机模型
假设输入空间是 $X\subseteq \mathbb{R}^{n}$ ，输出空间是 $Y=\left \{ +1,-1 \right \}$ 。输入 $x\in X$ 表示样本的特征向量，对应于输入空间的点，输出 $y\in Y$ 表示样本的类别。由输入空间到输出空间的函数如下：
$f(x)=sign(\omega\cdot x+b)\quad\quad(1)$
称为感知机，其中权值 $\omega$ 和偏置b是感知机模型的参数。
感知机是一种线性分类模型，属于判别模型，感知机的假设空间定义在特征空间中所有线性分类模型。
2、多层感知机及其BP算法
Deep Learning 近年来在各个领域都取得了 state-of-the-art 的效果，对于原始未加工且单独不可解释的特征尤为有效，传统的方法依赖手工选取特征，而神经网络可以进行学习，通过层次结构学习到更利于任务的特征。得益于近年来互联网充足的数据，计算机硬件的发展以及大规模并行化的普及。本文主要简单介绍 MLP ，也即为Full-connection Neural Network ，网络结构如下，分为输入，隐层与输出层，除了输入层外，其余的每层激活函数均采用 sigmod ，MLP 容易受到局部极小值与梯度弥散的困扰，如下图所示：
在这里插入图片描述
MLP 的 BP 算法基于经典的链式求导法则，首先看前向传导，对于输入层有 $I$ 个单元，对于输入样本 (x,z) ，隐层的输入为：
$\alpha_{h}=\sum_{i=1}^{I}\omega_{ih}x_{i}$
$b_{h}=f(\omega_{h})$
这里函数f为非线性激活函数，常见的有sigmod 或者是 tanh，本文选取 sigmod 作为激活函数。计算完输入层向第一个隐层的传导后，剩下的隐层计算方式类似，用 $h_{l}$ 表示第 $l$ 层的单元数：
$\alpha_{h}=\sum_{h^{'}=1}^{h_{l}-1}\omega_{h^{'}h}b_{h^{'}}$
$b_{h}=f(\omega_{h})$
对于输出层，若采用二分类即 logistic reg