（二）Softmax回归

最新推荐文章于 2023-11-18 16:42:28 发布

HawardScut

最新推荐文章于 2023-11-18 16:42:28 发布

阅读量350

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/hao5335156/article/details/80501928

版权

深度学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

1、分类模型

分类模型，例如Softmax回归。和线性回归不同，Softmax回归的输出单元从一个变成了多个。Softmax回归是一个单层神经网络。

2、Softmax运算

设带下标的w和b分别为Softmax回归的权重和偏差参数。给定单个图片的输入特征 $x1,x2,x3,x4$ ，有

o 1 = x 1 w 11 + x 2 w 21 + x 3 w 31 + x 4 w 41 + b 1, o 2 = x 1 w 12 + x 2 w 22 + x 3 w 32 + x 4 w 42 + b 2, o 3 = x 1 w 13 + x 2 w 23 + x 3 w 33 + x 4 w 43 + b 3 .

$\begin{split}o_1 = x_1 w_{11} + x_2 w_{21} + x_3 w_{31} + x_4 w_{41} + b_1,\\ o_2 = x_1 w_{12} + x_2 w_{22} + x_3 w_{32} + x_4 w_{42} + b_2,\\ o_3 = x_1 w_{13} + x_2 w_{23} + x_3 w_{33} + x_4 w_{43} + b_3.\end{split}$

这里写图片描述

在得到输出层的三个输出后，我们需要预测输出分别为lable1、lable12和lable3的概率。不妨设它们分别为 $\hat{y}_1, \hat{y}_2, \hat{y}_3$ 。下面，我们通过对 $o1,o2,o3$ 做Softmax运算，得到模型最终输出

y^1 = exp ( o 1 ) \sum 3 i = 1 exp ( o i ), y^2 = exp ( o 2 ) \sum 3 i = 1 exp ( o i ), y^3 = exp ( o 3 ) \sum 3 i = 1 exp ( o i ) .

$\begin{split}\hat{y}_1 = \frac{ \exp(o_1)}{\sum_{i=1}^3 \exp(o_i)},\\ \hat{y}_2 = \frac{ \exp(o_2)}{\sum_{i=1}^3 \exp(o_i)},\\ \hat{y}_3 = \frac{ \exp(o_3)}{\sum_{i=1}^3 \exp(o_i)}.\end{split}$
Softmax运算中的三式记作

y^1, y^2, y^3 = Softmax (o 1, o 2, o 3) .

$\hat{y}_1, \hat{y}_2, \hat{y}_3 = \text{Softmax}(o_1, o_2, o_3).$

3、交叉熵损失函数

Softmax回归使用了交叉熵损失函数（cross-entropy loss）。真实标分别对应离散值y1,y2,y3，它们的预测概率分别为 $y_1, y_2, y_3$ 。为了便于描述，设样本i的标签的被预测概率为 $p_{\text{label}_i} = \hat{y}_i$ 。例如，如果样本i的标签为y3，那么 $p_{\text{label}_i} = \hat{y}_3$ 。直观上，训练数据集上每个样本的真实标签的被预测概率越大（最大为1），分类越准确。假设训练数据集的样本数为n。由于对数函数是单调递增的，且最大化函数与最小化该函数的相反数等价，我们希望最小化

ℓ (Θ) = - 1 n \sum i = 1 n log p label i

$\ell(\boldsymbol{\Theta}) = -\frac{1}{n} \sum_{i=1}^n \log p_{\text{label}_i}$
其中

Θ Θ <script id="MathJax-Element-13" type="math/tex">Θ</script>为模型参数。该函数即 交叉熵损失函数。在训练Softmax回归时，我们将使用优化算法来迭代模型参数并不断降低损失函数的值。

HawardScut

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
（二）Softmax回归

1、分类模型分类模型，例如Softmax回归。和线性回归不同，Softmax回归的输出单元从一个变成了多个。Softmax回归是一个单层神经网络。2、Softmax运算设带下标的w和b分别为Softmax回归的权重和偏差参数。给定单个图片的输入特征x1,x2,x3,x4x1,x2,x3,x4x1,x2,x3,x4，有 o1=x1w11+x2w21+x3w31+x4w41+b1,o2=...
复制链接

扫一扫