CE和MSE的输入参量需不需要经过softmax

暗巷提灯

于 2024-02-14 13:08:42 发布

阅读量260

点赞数 3

文章标签：深度学习 pytorch 机器学习

本文链接：https://blog.csdn.net/m0_75015083/article/details/136112849

版权

CE中我们以torch.nn.functional.cross_entropy举例，我们自己输入进去的以一个参数只需要用logits即可，不需要经过softmax，第二个参量（即目标参量），一般用的是one-hot编码，也可以是经过softmax的class_probability。

MSE中我们以torch.nn.functional.mse_loss举例，输入的两个量其实同为softmax前或同为softmax后都可，主要看你着眼点在于原始的连续特征值还是预测为该特征的实际概率，根据需要可以进行调整。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

暗巷提灯

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

交叉熵CE VS MSE

静水流深，厚积薄发

06-09

1196

交叉熵CE VS MSE区别为什么MSE损失不适合用于分类？区别分类用交叉熵，回归用mse/mae，前者的假设是伯努利分布，后者假设是高斯分布。 CE衡量两个分布的距离，MSE衡量两个变量的距离。分类输出为概率分布，MSE更要求的是输入与输出一样，多用于计算两个东西是否一样。二者对于不同数据点的梯度不同，这种差异决定了其适用于不同的目标任务。CE比MSE更平缓，CE更强调定性特征而MSE更强调定量特征。交叉熵可以理解为另一种形式的keller散度，而keller散度是用于衡量两个模型的相似程度，

softmax,log_softmx,nll_loss和CELoss之间的关系

一千零一夜的博客

01-18

559

softmax,log_softmx,nll_loss和CELoss之间的关系

参与评论您还未登录，请先登录后发表或查看评论

BCE损失+sigmoid搭配、CE损失+softmax激活函数

weixin_44505185的博客

04-26

1903

BCE损失+sigmoid搭配、CE损失+softmax激活函数

为什么使用 CE + Softmax 作为损失函数

拾贝壳

08-17

958

假设假设有三个分类，模型输出值为 output = model(input)，得到如下输出向量 [o1,o2,o3] [o_1,o_2,o_3] [o1,o2,o3] 表示每个类别的概率值，然后将该向量进行 softmax 操作，得到 [S1,S2,S3][S_1,S_2,S_3][S1,S2,S3]，SiS_iSi 的计算公式为： Si=eoi∑eok=eoieo0+eo1+eo2 S_i = \frac{e^{o_i}}{\sum e^{o_k}} = \frac{e^{o_i}}{e^

LR+Sigmod+Softmax+CE

Walter

07-06

189

逻辑回归LR是机器学习中一种主流的分类模型，主要用于二分类问题。在这之前，线性回归多用来解决回归和分类问题，但是在分类问题中表现不佳，其输出值是不确定范围的。 LR将线性回归模型不确定范围的输出值通过Sigmod函数映射到（0,1）之间，即伯努利分布。确定LR的数学形式之后，一般通过最大似然估计来求解模型的参数，即找到一组参数使得输出概率最大。一般通过梯度下降法求解最优解。加入正则项后LR是严格的凸函数，一定存在全局最优解。将Sigmod函数换成Softmax函数便可解决多分类问题，计算每个目

softmax函数和softmax_loss

feiyanjia的博客

08-02

5635

softmax 函数 softmax(柔性最大值)函数，一般在神经网络中， softmax可以作为分类任务的输出层。其实可以认为softmax输出的是几个类别选择的概率，比如我有一个分类任务，要分为三个类，softmax函数可以根据它们相对的大小，输出三个类别选取的概率，并且概率和为1。 softmax函数的公式是这种形式： Si=ezi∑kezkSi=ezi∑kezk SiSi代表的...

基于MSELoss()与CrossEntropyLoss()的区别详解

09-18

需要注意的是，CrossEntropyLoss内部已经处理了softmax操作，因此在多分类任务中，网络的输出层不需要再进行softmax激活。 **实例分析：** 1. **CrossEntropyLoss示例**：在二分类问题中，假设网络的最后层输出...

psnr_mse.rar_MSE和PSNR_matlab mse_mse psnr_psnr mse_峰值信噪比

07-13

自动计算一幅图像的峰值信噪比PSNR和均方误差MSE

PSNRaMSE.rar_MSE PSNR_psnr mse_信噪比计算_峰值信噪比_计算psnr和mse

07-15

计算峰值信噪比PSNR和均方根误差MSE

M S E.rar_MSE SNR_ls mse_mse_mse.m_mse和snr的关系

07-13

利用LS算法仿真SNR与MSE之间的关系

【深度学习】神经网络中的蒸馏技术，从Softmax开始说起

fengdu78的博客

10-27

785

作者：Sayak Paul 编译：ronghuaiyang导读从各个层次给大家讲解模型的知识蒸馏的相关内容，并通过实际的代码给大家进行演示。本报告讨论了非常厉害模型优化技术 —...

入门级都能看懂的softmax详解

热门推荐

bitcarmanlee的博客

09-02

65万+

1.softmax初探在机器学习尤其是深度学习中，softmax是个非常常用而且比较重要的函数，尤其在多分类的场景中使用广泛。他把一些输入映射为0-1之间的实数，并且归一化保证和为1，因此多分类的概率之和也刚好为1。首先我们简单来看看softmax是什么意思。顾名思义，softmax由两个单词组成，其中一个是max。对于max我们都很熟悉，比如有两个变量a,b。如果a>b，则max为...

Softmax函数与交叉熵

behamcheung的博客

05-13

4万+

Softmax函数与交叉熵

训练分类器为什么要用cross entropy loss（交叉熵损失函数）而不能用mean square error loss（MSE,最小平方差损失函数）?

玉来愈宏的随笔

05-10

1万+

在一个人工智能群里，有人问起，训练分类器为什么要用cross entropy loss（交叉熵损失函数）而不能用mean square error loss（MSE,最小平方差损失函数）呢?正好，在我的那本《深度学习之美》（第11章）提及这个问题，于是复制了一部分内容，作为回答，群里的同学觉得通俗易懂，于是，把我的回答贴到这里，算是一个总结：---------对于多分类的标签（即教师信号），从本质...

机器学习_交叉熵

yeldon的博客

10-12

851

1. 引言我们都知道损失函数有很多种：均方误差（MSE）、SVM的合页损失（hinge loss）、交叉熵（cross entropy）。这几天看论文的时候产生了疑问：为啥损失函数很多用的都是交叉熵（cross entropy）？其背后深层的含义是什么？如果换做均方误差（MSE）会怎么样？下面我们一步步来揭开交叉熵的神秘面纱。 2. 交叉熵的来源 2.1 信息量一条信息的信息量大小和它的不确定性有很大的关系。一句话如果需要很多外部信息才能确定，我们就称这句话的信息量比较大。比如你听到“云南西双版

softmax ce loss_手写softmax和cross entropy

weixin_39517054的博客

11-26

178

import 解释下给定的数据，x假设是fc layer的输出，可以看到这里x是(3,3)的，也就是batch_size=3，n_classes=3。但是label给出了三个数，取值是0，1，因此这里必须要将label先变成one_hot的形式才能在cross_entropy函数中正确相乘。值得注意的点:softmax是有exp函数的，exp对很大的数会出现inf，因此这里要先针对每行数字减去每行...

关于SoftMax函数的一些介绍

三石的后花园

10-04

1万+

前言 SoftMax函数是在机器学习中经常出现的，时常出现在输出层中。对于这个函数，大部分blog作者对于它介绍已经很完善了，包括如何玄学设计，如何使用等等，这里只是从数学来源上讨论下这个函数名字的来历，或者说数学的来源，为什么叫做Soft Max（有没有Hard Max）等等。 1.Soft Max的形式 Soft Max 函数，全名Soft Maximum函数。其形式为σ(z)j=ezjΣk=...

深度学习学习笔记——线性分类器SVM和softmax分类器

phily123的博客

12-10

1149

参考链接：上图可以很明显看出SVM和softmax(其实就是CE)损失函数的区别： 1、对于SVM,先求出Xi属于每一类的分数（每一类的分数由这一类的分类器输出，所以三维的输出是三个分类器），如果正确类的分数比某一其他类分数差值低于1，那么相对于1的缺值会被添加到总的损失函数上，如果正确类损失函数分数比其他类分数高于1，对总的损失函数贡献为零。 2、对于sotamax分类器，先将每一输出值通过softmax函数归一化后转化成0和1之间的概率值，因为log函数在（0，1）之间时值为负，所以需要在损失函

sigmoid 和 softmax，BCE与CE loss function

weixin_37721058的博客

09-15

9322

一句话概括 sigmoid 激活函数二分类的激活函数解决我是和不是的问题对应二元交叉熵损失函数 softmax 激活函数多分类的激活函数解决我们中哪个是的问题对应多元交叉熵损失函数二分类推导为什么用交叉商：梯度下降的角度：从下面的推导过程可以看出来sigmoid对应的交叉商最后的梯度是一种残差。mse 是高斯分布的最大似然，二CE是多项式分布的最大似然。https://zhuan...

mseloss需要softmax吗