很大的logit如何合适地进行 Softmax？

Le0v1n

已于 2024-04-16 17:46:02 修改

阅读量373

点赞数

分类专栏： PyTorch 目标检测（Object Detection）分类（Classification）文章标签： pytorch 深度学习神经网络

于 2022-05-06 11:18:28 首次发布

搬的时候标注一下来源，谢谢。

本文链接：https://blog.csdn.net/weixin_44878336/article/details/124606061

版权

PyTorch 同时被 3 个专栏收录

68 篇文章 13 订阅

订阅专栏

目标检测（Object Detection）

28 篇文章 4 订阅

订阅专栏

分类（Classification）

17 篇文章 0 订阅

订阅专栏

0. 引言

假设最后的 logit 为：[15664, 15432, 14965]，对于这样的数据应该如何处理呢？

1. 直接进行 Softmax

>>> import torch
>>> a = torch.FloatTensor(3, )
>>> a[0], a[1], a[2] = 15664, 15432, 14965
>>> torch.nn.functional.softmax(a)
tensor([1., 0., 0.])

很明显，这样的结果并不是我们想要的。

2. 方法 1：先进行最大最小归一化再进行 Softmax

>>> import torch
>>> a = torch.FloatTensor(3, )
>>> a[0], a[1], a[2] = 15664, 15432, 14965
>>> logit = (a - torch.min(a)) / (torch.max(a) - torch.min(a))
>>> torch.nn.functional.softmax(logit)
tensor([0.4795, 0.3441, 0.1764])

3. 🥳方法 2：先进行 z-score 再进行 Softmax

>>> import torch
>>> a = torch.FloatTensor(3, )
>>> a[0], a[1], a[2] = 15664, 15432, 14965
>>> z_score = (a - a.mean()) / a.std()
>>> z_score
tensor([ 0.8717,  0.2200, -1.0917])
>>> torch.nn.functional.softmax(z_score)
tensor([0.6018, 0.3137, 0.0845])