【动手学深度学习】|多层感知机-3

秦悠

已于 2024-05-06 10:14:05 修改

阅读量881

点赞数 14

文章标签：深度学习人工智能

于 2024-03-28 21:47:47 首次发布

本文链接：https://blog.csdn.net/wp2cm/article/details/137125425

版权

文章目录

前言
一、感知机是什么？
总结

前言

学习资料
预备知识整理-1
线性神经网络-2

一、感知机是什么？

感知机是最简单的神经网络，为了解决其退化为线性模型的问题，引入了激活函数。
感知机perceptron
数学公式：
$\begin{cases} 0 \text{ }\text{ }\text{ }(w_1x_1+w_2x_2\le\Theta) \\ 1 \text{ }\text{ }\text{ }(w_1x_1+w_2x_2>\Theta) \end{cases} \tag{2.1}$

在上式子中倒入偏置 $b$ 权重 $w_1$ 和 $w_2$
$\begin{cases} 0 \text{ }\text{ }\text{ }(b+w_1x_1+w_2x_2\le0) \\ 1 \text{ }\text{ }\text{ }(b+w_1x_1+w_2x_2>0) \end{cases} \tag{2.2}$
偏置的值决定了神经元被激活的难易程度
感知机的局限性：单层感知机无法分割非线性空间。（线性空间、非线性空间）
与门、或门是单层感知机，异或门是2层感知机，叠加了多层的感知机为多层感知机（multi-layered perceptron）
在这里插入图片描述

感知机可以表示计算机，2层感知机（激活函数使用了sigmoid函数）可以表示任意函数。

激活函数

sigmoid函数

也叫挤压函数 squashing function
$h(x)=\frac{1}{1+exp(-x)} \tag{3.6}$

$\exp(-x)$ 表示 $e^{-x}$
$e$ 表示纳皮尔常数 2.7182……
阶跃函数和sigmoid函数的区别：
sigmoid函数的平滑性对神经网络的学习有重要作用
感知机中神经元之间流动的是0或1的二元信号，神经网络中流动的是连续的实数信号。
阶跃函数和sigmoid函数的相同点：
当输入信号为重要信息时，会输出较大的值，当输入信号为不重要的信息时，两者都输出较小的值
不管输入的信号有多小，或者有多大，输出信号的值都在0-1之间。
两者都是非线性函数
神经网络的激活函数必须使用非线性函数：使用线性函数时，无法发挥多层网络带来的优势，为了发挥叠加层所带来的优势，激活函数必须使用非线性函数。