吴恩达《机器学习》笔记——第八章《神经网络：表示》

肥胖边缘疯狂蹦迪

已于 2022-05-17 16:01:46 修改

阅读量363

点赞数

分类专栏：机器学习文章标签：机器学习深度学习神经网络

于 2022-05-17 12:02:19 首次发布

本文链接：https://blog.csdn.net/qq_43572747/article/details/124798434

版权

机器学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

8、Neural Networks: Representation（神经网络：表示）

8.1 Non-linear hypothesis（非线性假设）
8.3 Model representation I（模型展示 I）
8.4 Model representation II（模型展示 II）
8.7 Multi-class classification（多元分类）

8.1 Non-linear hypothesis（非线性假设）

神经网络在学习复杂的非线性假设上被证明是一种好的算法，即使输入特征空间很大，也能轻松搞定。

8.3 Model representation I（模型展示 I）

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真是世界物体所作出的交互反应。

神经网络中最基本的成分是神经元 (neuron/unit) 模型，即上述定义中的“简单单元”。下图展示了西瓜书中的神经元模型。
在这里插入图片描述
在这个模型中，神经元接收到来自n个其他神经元传递过来的输入信号，这些输入信号通过带权重的连接（connection）进行传递，神经元接收到的总输入将与神经元的阈值（threshold）进行比较，然后通过“激活函数”（activation function）处理以产生神经元的输出。该图中的权重 $\{\omega_i\}_{i=1}^n$ 就是前面的参数 $\{\theta_i\}_{i=1}^n$ ，阈值 $\theta$ 就是参数 $\theta_0$ 。

在吴恩达的视频中的神经元模型如下图所示： 在这里插入图片描述
这个图本质上和西瓜书中的模型是一样的。只不过该图把西瓜书中的阈值并入到了参数（权重），然后输入中多了一个相应的偏置单元 $x_0$ 。下面的笔记都以吴恩达视频中的图为例，即将阈值并入到参数中。

理想中的激活函数是下图所示的阶跃函数，它将输入值映射为输出值0或1。然而，阶跃函数具有不连续、不光滑等不太好的性质，因此实际常用Sigmoid函数作为激活函数。注：激活函数有很多种，Sigmoid函数只是其中的一种；对于输出层，激活函数就不用将输入值映射到 $(0, 1)$ ，比如在回归问题中，输出层的激活函数可以是恒等函数。在这里插入图片描述
神经网络模型如下图所示：

Layer1称为输入层，Layer2称为隐藏层（隐藏层可以不止有一层），Layer3称为输出层。 $a_i^{(j)}$ 是第 $j$ 层第 $i$ 个神经元的激活项， $\Theta^{(j)}$ 是第 $j$ 层到第 $j + 1$ 层的映射矩阵。当然输出层的 $h_\Theta(x)$ 不一定要带有激活函数，即使带有激活函数也有多种可能。
在这里插入图片描述

8.4 Model representation II（模型展示 II）

这一节所做的事情就是将神经网络中各层之间的映射向量化。如图所示的前向传播：
在这里插入图片描述
将第 $l + 1$ 层在激活函数之前的值（即第 $l$ 层的输出 $a^{(l)}$ 的线性组合 $\Theta^{(l)}a^{(l)}$ ）记为 $z^{(l+1)}$ ，输出记为 $a^{(l+1)}$ ，这样记做的目的是方便后面第九章的反向传播算法求导时的简洁。

8.7 Multi-class classification（多元分类）

对于回归问题和二分类问题，输出层只需要一个神经单元；但是对于多分类问题，输出层就需要多个神经单元。比如多分类，分成4类，输出层就有4个单元，用向量表示就是输出层是一个4维的向量，该向量只有一个值为1，其余为0。如下图所示：在这里插入图片描述

肥胖边缘疯狂蹦迪

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
吴恩达《机器学习》笔记——第八章《神经网络：表示》

8、Neural Networks: Representation（神经网络：表示）8.1 Non-linear hypothesis（非线性假设）8.3 Model representation I（模型展示 I）8.4 Model representation II（模型展示 II）8.7 Multi-class classification（多元分类）8.1 Non-linear hypothesis（非线性假设）神经网络在学习复杂的非线性假设上被证明是一种好的算法，即使输入特征空间很大，也能轻松
复制链接

扫一扫