神经网络（三）—— 神经元多输出

最新推荐文章于 2025-02-16 23:11:08 发布

HikariXuXu

最新推荐文章于 2025-02-16 23:11:08 发布

阅读量5.7k

点赞数

分类专栏：神经网络文章标签：神经网络机器学习深度学习人工智能

本文链接：https://blog.csdn.net/HikariXuXu/article/details/107834052

版权

神经网络专栏收录该内容

4 篇文章

订阅专栏

本系列为慕课网《深度学习之神经网络(CNN/RNN/GAN)算法原理+实战》视频笔记，希望自己能通过分享笔记的形式更好的掌握该部分内容。
往期回顾：
神经网络（一）—— 机器学习、深度学习简介
神经网络（二）—— 神经元、Logistic回归模型

多分类的Logistic回归模型

多个神经元就可以得到多个输出！由此，我们可以得到多分类的Logistic回归模型。

$W$ 从向量扩展为矩阵
输出 $W * x$ 则变成向量

上图为两个神经元组成的三分类模型，每个神经元有不同的权重 $W$ 。

Example：

$X = [3, 1, 2]$ ， $W = [[0.4, 0.6, 0.5], [0.3, 0.2, 0.1]]$ ，
then, $Y=[y_0,y_1]=[W[0]*x,W[1]*x]=[2.8,1.3]$

多输出神经元 $\rightarrow$ softmax $\rightarrow$ 多分类Logistic回归模型

前一节（神经元、Logistic回归模型）我们已经学过了二分类Logistic回归模型通过sigmoid函数给出分类概率。但我们还可以换一个角度，把它看成将 $1$ 和 $e^{-w^Tx}$ 做归一化。
fig2. 二分类Logistic回归分类概率的另一种解释角度
对于 $K$ 个分类的分类问题，如下图所示， $W$ 为一个 $K - 1$ 行的矩阵，将 $K - 1$ 个值和 $1$ 一起做归一化，给出 $K$ 个类别的分类概率。
fig3. Logistic回归处理多分类问题的分类概率
具体地分类概率：
$P(Y=k|x)=h_w(x)=\frac{e^{-w^T_kx}}{1+\Sigma_1^{k-1} e^{-w^T_kx}}, \ k=1,2,...,K-1$
$P(Y=k|x)=1-h_w(x)=\frac{1}{1+\Sigma_1^{k-1} e^{-w^T_kx}}, \ k=K$

Example:

$Y=[y_0,y_1]=[2.8,1.3]$
$e^{-Y}=[e^{-2.8},e^{-1.3}]=[0.06,0.27]$
$S u m = 1 + 0.06 + 0.27 = 1.33$
$P (Y = 0 ∣ x) = 0.06 / 1.33 = 0.045$
$P (Y = 1 ∣ x) = 0.27 / 1.33 = 0.203$
$P (Y = 2 ∣ x) = 1.00 / 1.33 = 0.752$
从Logistic回归模型的介绍，我们可以看出其实我们也可以把Logistic回归模型看成神经网络，多分类的Logistic回归模型已经有多个神经元了。