pytorch学习笔记（三）用nn.cross_entropy所遇到的问题

最新推荐文章于 2024-08-23 16:49:02 发布

hellosonny

最新推荐文章于 2024-08-23 16:49:02 发布

阅读量4.3k

点赞数 1

本文链接：https://blog.csdn.net/creator180/article/details/93601469

版权

本文通过Mnist数据集实例，探讨使用PyTorch中nn.CrossEntropyLoss时遇到的问题。在训练过程中，由于实际输出yb与模型预测输出model(xb)尺寸不匹配，导致RuntimeError。解决方法是确保yb和model(xb)尺寸一致。

摘要由CSDN通过智能技术生成

Mnist数据集的图片尺寸一般是28*28 = 784,这里模拟一下搭建一个神经元的网络来进行预测和loss的计算，代码如下。

import torch
from torch import nn
import math
import torch.nn.functional as F

class Mnist_net(nn.Module):
    def __init__(self):
        super().__init__()
        self.weights = nn.Parameter(torch.randn(784,10)/math.sqrt(784))
        self.bias = nn.Parameter(torch.zeros(10))

    def forward(self,xb):
        xb = xb@self.weights +self.bias
        return xb

model = Mnist_net()
loss_func = F.cross_entropy
xb = torch.randn(2,784)
yb = torch.tensor([1,1])
print ("model(xb):",model(xb))
print ("yb:",yb)
loss = loss_func(model(xb),yb)
print ("loss:",loss)

这里要注意的是yb是实际输出的标注，model（xb）是预测的输出，这里yb和model（xb）是不同的尺寸，如下。

model(xb): tensor([[ 0.3825, -0.0071,  0.4110, -0.0534, -0.3756,  0.7349, -3.1753,  0.7359,
         -0.1801,  0.1951],
        [-1.4873,

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hellosonny

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【Pytorch学习笔记】交叉熵损失函数CrossEntropyLoss的案例使用

热情、奔放、快乐编程！

11-29

1453

分类问题常用的损失函数为交叉熵（Cross Entropy Loss）。交叉熵描述了两个概率分布之间的距离，交叉熵越小说明两者之间越接近。熵是信息量的期望值，它是一个随机变量的确定性的度量。熵越大，变量的取值越不确定；反之，熵越小，变量取值就越确定。本文将使用交叉熵损失函数用作一个简单案例，代码仅供参考学习！提示：以下是本篇文章正文内容，下面案例可供参考在分类问题中用交叉熵可以更好的体现loss的同时，使其仍然是个凸函数，这对于梯度下降时的搜索很有用。

『NLP学习笔记』Cross Entropy Loss 的硬截断、软化到 Focal Loss

AI新视界

04-12

1688

对于二分类模型，我们总希望模型能够给正样本输出 1，负样本输出 0，但限于模型的拟合能力等问题，一般来说做不到这一点。而事实上在预测中，我们也是认为大于 0.5 的就是正样本了，小于 0.5 的就是负样本。这样就意味着，我们可以 “有选择” 地更新模型，比如，设定一个阈值为 0.6，那么模型对某个正样本的输出大于 0.6，我就不根据这个样本来更新模型了，模型对某个负样本的输出小于 0.4，我也不根据这个样本来更新模型了，只有在 0.4~0.6 之间的，才让模型更新，这时候模型会更 “集中精力” 去关心那些

参与评论您还未登录，请先登录后发表或查看评论

图像识别-pytorch-RuntimeError: expected scalar type Long but found Int

shinner2019的博客

03-08

4835

RuntimeError: expected scalar type Long but found Int

pytorch CrossEntropyLoss 报错问题

qq_33385229的博客

11-26

581

https://www.cnblogs.com/blogwangwang/p/12018897.html 简单来说mse里传入的可以是数值的数组（有维度但是crossEntropy里传入的东西不能有维度

pytorch 交叉熵损失详解

最新发布

qq_44911284的博客

08-23

131

H(P,Q) = -∑ P(x) * log(Q(x))，其中P和Q分别表示两个概率分布，P(x)表示事件x在真实分布中的概率，Q(x)表示事件x在预测分布中的概率，log表示自然对数。对生成的预测， 3,3 在预测的维度上使用softmax归一化，然后得到了三个样本的 0~1 ,然后使用log函数对预测值取log ,然后再 NLLloss。pytorch中的 nn.CrossEntropyLoss() 计算得到的结果与 softmax-log-NLLLoss计算得到的结果是一致的。

【Tensorflow】ValueError: Only call `sigmoid_cross_entropy_with_logits` with named arguments

XD的学习笔记

03-10

533

报错信息 ValueError: Only call softmax_cross_entropy_with_logits with named arguments (labels=…, logits=…, …) 解决方法在方法内加上labels=…, logits=…, 报错代码 my_vals = tf.nn.sigmoid_cross_entropy_with_logits(my_logit...

交叉熵损失函数学习

qq_45759229的博客

05-05

283

主要看定义，函数的输入和输出。

loss = F.cross_entropy（）函数总结

wzw845212252的博客

03-01

3018

CrossEntropyLoss: 交叉熵损失函数。交叉熵描述了两个概率分布之间的距离，当交叉熵越小说明二者之间越接近。使用这个函数时应该特别注意out是没有经过softmax处理过的。因为调用F.cross_entropy函数时会通过log_softmax和nll_loss来计算损失，也就是说使用F.cross_entropy函数时，程序会自动先对out进行softmax，再log，最后再计算nll_loss。换句话说，执行F.cross_entropy时，相当于执行以下代码： soft_out =

pytorch学习笔记三：torch.nn下常见的几个损失函数详解

耐心的小黑的博客

04-07

1万+

在盘点常见损失函数之前，有必要先说一下在很多的损失函数中都出现的三个参数，也即size_average,reduce以及reduction，并且它们三个之间还存在一定的关系。 size_average：bool类型；默认情况下，如果只有一个batch，每个batch有多个元素，那么误差计算结果是这个batch中多个元素的平均值；如果是有多个batch，然后每个batch有多个元素，那么误差计算...

CrossEntropyLoss的理解

iwill323的博客

08-13

1027

对pytorch交叉熵的理解

F.cross_entropy、logsoftmax、nll_loss详解

weixin_40198079的博客

01-13

2994

F.cross_enropy的实际计算方法探索

python numpy.cross函数计算出问题

Hsin_Ching的博客

01-14

1187

python numpy.cross函数计算出问题我将向量里的数值都乘以1000后，原始数值用cross函数计算的值和乘以1000过后用cross计算的值不相同，不知道问题出在哪？问题描述：当用numpy.cross函数做两个向量的叉乘的时候，以km和m为单位，计算的结果是不同的，用自己写的函数计算是正常的。以m为单位时，数值乘了1000，计算就出错了。 import numpy as np x = [-6045000, -3490000, 2500000] y = [-3457, 6618,

【Pytorch学习】图像分类从逻辑回归到CNN

AI知识搬运工

02-15

1195

【Pytorch学习】图像分类从逻辑回归到CNN 1,未调用torch.nn接口，原始编程实现最小的逻辑回归神经网络 from pathlib import Path import requests DATA_PATH = Path("data") PATH = DATA_PATH / "mnist" PATH.mkdir(parents=True, exist_ok=True) URL = "https://github.com/pytorch/tutorials/raw/master/_st

PyTorch学习笔记（2）--损失CrossEntropyLoss()与cross_entropy()

m0_61385981的博客

04-14

1482

损失CrossEntropyLoss()与cross_entropy()

交叉熵损失（Cross Entropy Loss）计算过程