机器学习——感知器

最新推荐文章于 2024-02-19 11:00:00 发布

有梦想的雨

最新推荐文章于 2024-02-19 11:00:00 发布

阅读量1.8k

点赞数

分类专栏：机器学习文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/qq_41536160/article/details/122222881

版权

机器学习专栏收录该内容

21 篇文章 15 订阅

订阅专栏

单个感知器

一个最简单的感知器示意图如下所示：
在这里插入图片描述

功能描述

设样本集 $\mathbf X=\{X_1,X_2,\cdots,X_i,\cdots,X_m\}$ ，记输入向量 $X_i=X=(x_1,x_2,\cdots,x_n)^T$ ，则输入向量可表示为高维空间中的一个点；感知器 $j$ 对应的权重为 $w_j=(w_{1j},\cdots,w_{nj})^T$ ，阈值为 $\theta_j$ 。通过训练，可使得感知器 $j$ 的输出为
$\displaystyle \hat y_j=sign\{w^T_j\cdot X_i-\theta_j\}=sign\{\sum^n_{k=1}w_{kj}\cdot x_k-\theta_j\}=\left\{ \begin{aligned} 1, & & {\sum^n_{k=1}w_{kj}\cdot x_k-\theta_j>0}\\ -1, & & {\sum^n_{k=1}w_{kj}\cdot x_k-\theta_j<0}\\ \end{aligned} \right.$

即由方程 $\displaystyle w^T_j\cdot X_i-\theta_j=\sum^n_{k=1}w_{kj}\cdot x_k-\theta_j=0$ 确定的超平面将超空间分为两部分。其具有分类功能，分类原理是将分类知识储存与感知器的权重向量（包含阈值）中，由权重向量确定的分类判决面将输入模式（向量）分为两类。但应注意，分类判决面不是唯一的。对于二维空间内的样本，其示意图如下：
在这里插入图片描述

训练

使用增广向量，用 $w^T_j\cdot X_i$ 替代 $w^T_j\cdot X_i-\theta_j$ 。定义感知器的损失函数为 $\displaystyle L(w_j)=\sum^m_{i=1}\mathbf I\{y_i\cdot w^T_j\cdot X_i<0\}$ ，

其中 $y_i=\{1,-1\}$ ，为样本 $X_i$ 的标签； $\mathbf I\{y_i\cdot w^T_j\cdot X_i<0\}$ 的含义为：正确分类时， $y_i\cdot w^T_j\cdot X_i>0,\mathbf I=0$ ；
错误分类时， $y_i\cdot w^T_j\cdot X_i<0,\mathbf I=1$ ；调整 $\omega\gets w+\triangle\omega$ 。

注意到， $\displaystyle L(w_j)=\sum^m_{i=1}\mathbf I\{y_i\cdot w^T_j\cdot X_i<0\}$ 是不可导的，这不利于学习，
因此考虑将损失函数定义为 $\displaystyle L(w_j)=\sum_{X_i\in\mathbf X}-y_i\cdot w^T_j\cdot X_i$ ，其梯度为： $\displaystyle\nabla_{\omega_j}L=-y_i\cdot X_i$ ，
对每个分类错误的样本，都对 $\omega_j$ 进行调整： $\omega\gets w+\lambda\nabla_{\omega_j}L$ ，直到所有的样本分类正确为止。

逻辑运算能力

逻辑“与”

根据逻辑“与” 的真值表，进行训练，可得到判决方程（不唯一）为： $0.5x_1+0.5x_2-0.75=0$
在这里插入图片描述

逻辑“或”

根据逻辑“与” 的真值表，进行训练，可得到判决方程（不唯一）为： $x_1+x_2-0.75=0$
在这里插入图片描述

感知器的局限性

可以看出，感知器只能得到线性分类判决面，其在二维时是直线，故无法实现“异或”功能；并且，感知器仅度线性可分问题具有分类能力。如果两类样本可以用直线、平面或超平面分开，称为线性可分；否则称为线性不可分。

多层感知器

因为单个感知器无法实现线性不可分问题，因此考虑引入多层感知器，其网络结构即输入输出函数如下：
在这里插入图片描述

假定隐层的节点可以根据需要自由设置，则使用三层的阈值网络可以实现任意的二值逻辑函数。解决异或问题的二层网络（不唯一）如下所示：
在这里插入图片描述

其分类面的叠加原理如下所示：
在这里插入图片描述

多层感知器的拟合能力

二层感知器

在这里插入图片描述

三层感知器

在这里插入图片描述

可以看出，单层感知器的判决域是半平面；双层感知器（一个隐层）的判决域为开放式闭合的凸域；而三层感知器（两个隐层，不限制隐层节点数）的判决域为任意复杂形状的域。

多层感知器的分类原理：隐含层实现对输入空间的非线性映射，输出层实现线性分类；使得非线性映射方式和线性判别函数可以同时学习。
在这里插入图片描述

有梦想的雨

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习——感知器

单个感知器一个最简单的感知器示意图如下所示：功能描述设样本集 X={X1,X2,⋯ ,Xi,⋯ ,Xm}\mathbf X=\{X_1,X_2,\cdots,X_i,\cdots,X_m\}X={X1,X2,⋯,Xi,⋯,Xm}，记输入向量 Xi=X=(x1,x2,⋯ ,xn)TX_i=X=(x_1,x_2,\cdots,x_n)^TXi=X=(x1,x2,⋯,xn)T，则输入向量可表示为高维空间中的一个点；感知器 jjj 对应的权重为 wj=(w1j,⋯ ,wnj)Tw_j=(w_
复制链接

扫一扫

专栏目录