机器学习:感知机

本文介绍了感知机模型,作为二分类的线性分类模型,以及其在机器学习中的应用。接着详细阐述了多层感知机(MLP)的结构和反向传播(BP)算法,特别是激活函数、损失函数以及反向传播过程中的残差传递。通过理解这些概念,有助于深入学习神经网络的工作原理。
摘要由CSDN通过智能技术生成

感知机是二分类的线性分类模型,其输入是样本的特征向量,输出是样本的类别。感知机对应于输入空间中将样本划分为两个类别,属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。
1、感知机模型
假设输入空间是 X ⊆ R n X\subseteq \mathbb{R}^{n} XRn,输出空间是 Y = { + 1 , − 1 } Y=\left \{ +1,-1 \right \} Y={ +1,1}。输入 x ∈ X x\in X xX表示样本的特征向量,对应于输入空间的点,输出 y ∈ Y y\in Y yY表示样本的类别。由输入空间到输出空间的函数如下:

称为感知机,其中权值 ω \omega ω和偏置b是感知机模型的参数。
感知机是一种线性分类模型,属于判别模型,感知机的假设空间定义在特征空间中所有线性分类模型。
2、多层感知机及其BP算法
Deep Learning 近年来在各个领域都取得了 state-of-the-art 的效果,对于原始未加工且单独不可解释的特征尤为有效,传统的方法依赖手工选取特征,而 神经网络可以进行学习,通过层次结构学习到更利于任务的特征。得益于近年来互联网充足的数据,计算机硬件的发展以及大规模并行化的普及。本文主要简单介绍 MLP ,也即为Full-connection Neural Network ,网络结构如下,分为输入,隐层与输出层,除了输入层外,其余的每层激活函数均采用 sigmod ,MLP 容易受到局部极小值与梯度弥散的困扰,如下图所示:
在这里插入图片描述
MLP 的 BP 算法基于经典的链式求导法则,首先看前向传导,对于输入层有 I I I 个单元, 对于输入样本 (x,z) ,隐层的输入为:


这里函数f为 非线性激活函数,常见的有sigmod 或者是 tanh,本文选取 sigmod 作为激活函数。计算完输入层向第一个隐层的传导后,剩下的隐层计算方式类似,用 h l h_{l} hl 表示第 l l l层的单元数:


对于输出层,若采用二分类即 logistic reg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值