nll_loss = log_probs.gather(dim=-1, index=labels)

最新推荐文章于 2024-10-05 20:00:00 发布

Joe_Hall_Lee

最新推荐文章于 2024-10-05 20:00:00 发布

阅读量216

点赞数 3

文章标签： pytorch python

本文链接：https://blog.csdn.net/Joe_Hall_Lee/article/details/140882291

版权

这个 gather 函数是 PyTorch 中的一个函数，它用于从一个张量中按照指定的索引取值。

在这里，log_probs 是一个形状为 (batch_size, sequence_length, vocab_size) 的张量，每个元素代表一个词汇在序列中的对数概率。

labels 是一个形状为 (batch_size, sequence_length) 的张量，每个元素代表一个序列中的真实标签的索引。

gather 函数的作用是，从 log_probs 中按照 labels 的索引取值。也就是说，它会从 log_probs 的最后一维（即 vocab_size 维度）中取出与 labels 中索引对应的值。

举个例子，如果 log_probs 是这样的：

[[[0.1, 0.2, 0.3, 0.4],
  [0.5, 0.6, 0.7, 0.8],
  [0.9, 0.10, 0.11, 0.12]],

 [[0.13, 0.14, 0.15, 0.16],
  [0.17, 0.18, 0.19, 0.20],
  [0.21, 0.22, 0.23, 0.24]]]

labels 是这样的：

[[1, 2, 3],
 [0, 1, 2]]

那么 gather 函数会取出以下值：

[[0.2, 0.7, 0.12],
 [0.14, 0.18, 0.23]]

这些值就是 nll_loss 的值，它们代表了真实标签在序列中的对数概率。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Joe_Hall_Lee

关注关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

几种常见的计算机视觉中的损失函数原理理解&分析

l13022736018的博客

06-25

4269

机器学习任务中适用损失函数来计算描述预测结果和实际事实之间的差距，通过损失函数来量化这个差距从而判断预测的错误程度。因此选择适当的损失函数将有助于获得较好的结果。这里将尝试分析理解计算机视觉中一些基本的损失函数和图像分类、图像检测以及图像分割任务中常用的主流损失函数。

标签平滑（LabelSmoothing）介绍与代码实现

年少的勇气已经用完，剩下的就是三思而后行

07-20

2070

标签平滑（），像L1、L2和dropout一样，是机器学习领域的一种正则化方法，通常用于分类问题，目的是防止模型在训练时过于自信地预测标签，改善泛化能力差的问题。

参与评论您还未登录，请先登录后发表或查看评论

大模型入门（六）—— RLHF微调大模型

chaishen10000的专栏

06-15

5279

所以价值的计算如下：核心是下面的delta的计算，除了考虑到当前的时刻的奖励值，还考虑到了未来时刻的输出的奖励值nextvalues（只不过这里的奖励值是由critic网络直接输出的每个token对应的分数）。从上图可以看出，给定一个输入x，会生成两个文本y11和y22，一个来自于初始的模型，另一个来自于微调的模型，微调的模型生成的文本还会进入到奖励模型中打分输出rθ，而初始模型和微调的模型生成的结果会用KL散度约束它们的分布，确保模型不会太偏离原来的模型，并且能输出高质量的回复。

torch.gather 解释&示例

BlackZhou013的博客

03-20

2607

是一个PyTorch函数，用于按照给定的索引从输入张量中收集指定的元素。它接受三个参数：input：输入张量，其形状为(B, N, C)，其中B表示批次大小，N表示每个批次中的元素数，C表示每个元素的特征数。dim：表示需要收集的维度。例如，如果dim=1，则表示沿着第二个维度收集元素。index：一个张量，包含了从输入张量input中收集元素所需的索引。它的形状为(B, M)，其中M表示每个批次中要收集的元素数量。函数会返回一个形状为(B, M, C)

多分类svm的hinge loss公式推导_【CNN调参】图像分类算法优化技巧（实用性很高）

weixin_39676034的博客

11-13

564

★ 这篇论文整理了CNN分类任务中一些常用的Tricks，如改善模型结构，训练过程中的一些Refinements如修改损失函数，数据预处理等，有较大工程意义。 ”1. 前言这篇论文的全名是：Bag of Tricks for Image Classification with Convolutional Neural Networks 。论文地址见附录。这篇论文是亚马逊团队对CNN网络调优的经验...

标签平滑Label Smoothing Demo(附pytorch的NLLLoss()，gather())

weixin_46854356的博客

12-14

PS：mnist直接套上LabelSmoothing的外壳？没问题，跳转https://www.cnblogs.com/jie-74/p/15686550.html LabelSmoothing.py import torch import torch.nn as nn import torch.nn.functional as F from torch.autograd import V...

nll_loss = -logprobs.gather(dim=-1, index=target.unsqueeze(1))

07-17

这段代码是使用负对数似然损失（Negative Log Likelihood Loss）来计算多标签分类问题的损失。首，`logprobs`是模型预测的结果，它是一个张量，形状为(batch_size, num_labels)，其中`batch_size`是批量的大小，`...

model = CBOW(word_size, EMDEDDING_DIM) loss_function = nn.NLLLoss() optimizer = torch.optim.SGD(model.parameters(), lr=0.001) #开始训练 for epoch in range(100): total_loss = 0 for context, target in data: context_vector = make_context_vector(context, word_to_ix) log_probs = model(context_vector) total_loss += loss_function(log_probs, torch.tensor([word_to_ix[target]])) optimizer.zero_grad() total_loss.backward() optimizer.step()

07-14

首先，通过实例化 CBOW 模型来创建一个模型对象，其中 word_size 是词汇表的大小，EMBEDDING_DIM 是嵌入维度。然后，定义损失函数为负对数似然损失函数（NLLLoss）。接着，创建一个优化器对象，使用随机梯度下降...

class SoftmaxFocalLoss(nn.Module): def __init__(self, gamma, ignore_lb=255, *args, **kwargs): super(FocalLoss, self).__init__() self.gamma = gamma self.nll = nn.NLLLoss(ignore_index=ignore_lb) def forward(self, logits, labels): scores = F.softmax(logits, dim=1) factor = torch.pow(1.-scores, self.gamma) log_score = F.log_softmax(logits, dim=1) log_score = factor * log_score loss = self.nll(log_score, labels) return loss

07-17

这是一个名为SoftmaxFocalLoss的...最后，使用NLLLoss函数计算log_score和labels之间的负对数似然损失loss，并返回该损失值。这个损失函数的目的是在多分类问题中减小易分类样本的权重，以便更加关注困难样本的训练。

【pytorch笔记】损失函数nll_loss