通俗的理解线性回归，softmax回归，损失函数

最新推荐文章于 2023-05-25 11:00:50 发布

shan_shmily

最新推荐文章于 2023-05-25 11:00:50 发布

阅读量563

收藏 3

点赞数 1

文章标签：回归线性回归机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shan_5233/article/details/126255996

版权

线性回归

引例：预测房屋的价格，影响价格的因素有很多，比如面积、地段、房龄等，设房屋面积x1，房龄x2，售出价格y，线性回归假设各个输出和输入的线性关系为
$\begin{array}{c} \hat{y}=x_{1} w_{1}+x_{2} w_{2}+b \end{array}$
w1和w2是权重，b是偏差, $\hat{y}$ 是对真实值的预测。

线性回归是一个单层神经网络。
线性回归的输出是一个连续值。

softmax回归

softmax回归本质上是一个分类问题，而线性回归是回归问题。softmax回归的输出数量等于类别数量，相当于属于某一类别的概率（后面说怎么来的），比如4个特征的3个输出的表达式为 $\begin{array}{l} o_{1}=x_{1} w_{11}+x_{2} w_{21}+x_{3} w_{31}+x_{4} w_{41}+b_{1} \\ o_{2}=x_{1} w_{12}+x_{2} w_{22}+x_{3} w_{32}+x_{4} w_{42}+b_{2} \\ o_{3}=x_{1} w_{13}+x_{2} w_{23}+x_{3} w_{33}+x_{4} w_{43}+b_{3} . \end{array}$

sofymax也是单层神经网络

$o_{i}$ 可以表示属于某个类别的置信度，将输出最大值作为预测输出。比如如果 $o_{1}$ , $o_{2}$ , $o_{3}$ 分别为0.1,10,0.1，那么预测类别为2.由于这些输出值的差异比较大，可以使用softmax运算符将输出值变换成值为正且和为的概率分布：
$\hat{y}_{1}, \hat{y}_{2}, \hat{y}_{3}=\operatorname{softmax}\left(o_{1}, o_{2}, o_{3}\right)$ 其中 $\hat{y}_{1}=\frac{\exp \left(o_{1}\right)}{\sum_{i=1}^{3} \exp \left(o_{i}\right)}, \quad \hat{y}_{2}=\frac{\exp \left(o_{2}\right)}{\sum_{i=1}^{3} \exp \left(o_{i}\right)}, \quad \hat{y}_{3}=\frac{\exp \left(o_{3}\right)}{\sum_{i=1}^{3} \exp \left(o_{i}\right)} .$
如果 $\hat{y}_{2}$ =0.8，表示预测为类别2的概率为80%。
softmax的标准形式
$\begin{array}{l} \boldsymbol{o}^{(i)}=\boldsymbol{x}^{(i)} \boldsymbol{W}+\boldsymbol{b} \\ \hat{\boldsymbol{y}}^{(i)}=\operatorname{softmax}\left(\boldsymbol{o}^{(i)}\right) \end{array}$
对于上面特例中的权重和偏差为： $\boldsymbol{W}=\left[\begin{array}{lll} w_{11} & w_{12} & w_{13} \\ w_{21} & w_{22} & w_{23} \\ w_{31} & w_{32} & w_{33} \\ w_{41} & w_{42} & w_{43} \end{array}\right], \quad \boldsymbol{b}=\left[\begin{array}{lll} b_{1} & b_{2} & b_{3} \end{array}\right]$
特征为： $\boldsymbol{x}^{(i)}=\left[\begin{array}{llll} x_{1}^{(i)} & x_{2}^{(i)} & x_{3}^{(i)} & x_{4}^{(i)} \end{array}\right]$

损失函数

通俗的理解：神经网络的标准和你心中的标准相差的定量的表达。

最小二乘法

$\mathcal{L}(\hat{y} \cdot y)=\frac{1}{2}(\hat{y}-y)^{2}$ 其中 $\hat{y}$ 表示神经网络（nn）预测的输出，y表示真实的标签。

极大似然估计

通俗理解：计算nn里面概率模型的最大似然值。
ps：懒得打了，直接上图片吧，哈哈哈
请添加图片描述

交叉熵

请添加图片描述

shan_shmily

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shan_shmily 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

打赏作者

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值