神经网络 (Neural Network)

最新推荐文章于 2024-01-09 10:16:42 发布

lynn_1900

最新推荐文章于 2024-01-09 10:16:42 发布

阅读量308

点赞数 1

分类专栏：机器学习文章标签：神经网络算法 python 机器学习深度学习

本文链接：https://blog.csdn.net/lynn_1900/article/details/106720076

版权

本文详细介绍了神经网络的前向传播模型、决策函数、代价函数及其梯度反向传播算法，涉及激活函数如ReLU、tanh和sigmoid，并讨论了多分类任务的训练数据集和代价函数。此外，还阐述了神经网络的训练目标和梯度下降算法在求解最优参数中的应用。

摘要由CSDN通过智能技术生成

1 模型

前向传播模型 (Forward Propogation)

设有 $n$ 个输入神经元(特征)， $K$ 个输出神经元(分类)， $L$ 层神经元 (不包括输入层)，每层 $s_{l}$ 个神经元，第 $l - 1$ 层到 $l$ 层的参数矩阵为 $W(l)\in\mathbb{R}^{s_{l-1}\times s_{l}}$ ，偏置项为 $b{(l)}\in\mathbb{R}^{1\times s_{l}}$ ，记 $\Theta=(W,b)$ .
$\begin{aligned} Layer\ 0:\ &a(0) = \color{red}{x} \\ Layer\ 1:\ &z(1)=a^{T}(0)W(1)+b(1), \\ &a(1) = g_{1}\left(z(1)\right) \\ &\ \ \vdots \\ Layer\ l:\ &z(l)=a^{T}(l-1)W(l)+b(l), \\ &a(l) = g_{l}\left(z(l)\right)\\ &\ \ \vdots \\ Layer\ L:\ &z(L)=a^{T}(L-1)W(L)+b(L),\\ &{\color{red}{\hat{y}}}=a(L)= g_{L}\left(z(L)\right)\\ \end{aligned}$
其中，
$\begin{aligned} x &= \left[\begin{matrix} x^{(1)}\\ \vdots \\x^{(n)} \end{matrix}\right], \quad a(l) = \left[\begin{matrix} a^{(1)}(l) \\ \vdots \\a^{(s_{l})}(l) \end{matrix}\right] \\\\ W(l) &= \left[\begin{matrix} w_{11}(l) & \cdots & w_{1,s_{l}}(l) \\ \vdots & & \vdots \\ w_{s_{l-1},1}(l) & \cdots & w_{s_{l-1},s_{l}}(l) \end{matrix}\right],\quad l=1,\cdots, L \\\\ b(l) &= \left[\begin{matrix} b_{1}(l) & \cdots & b_{s_{l}}(l) \end{matrix}\right],\quad l=1,\cdots, L \\\\ \end{aligned}$
$g$ 称为激活函数，常见的激活函数有 $R e L U s, t a n h, i g m o i d, s o f t m a x$ ，通常隐藏层取 $g (z) = R e L U (z)$ ，在二分类情况下输出层取 $g (z) = s i g m o i d (z)$ ，在多分类情况下输出层取 $g (z) = s o f t m a x (z)$ .