2020-12-19 nn.CrossEntropyLoss()

最新推荐文章于 2024-07-27 20:20:27 发布

充实而又快乐

最新推荐文章于 2024-07-27 20:20:27 发布

阅读量246

点赞数 1

分类专栏：笔记文章标签： python

本文链接：https://blog.csdn.net/weixin_41807182/article/details/111412005

版权

笔记专栏收录该内容

16 篇文章 0 订阅

订阅专栏

nn.CrossEntropyLoss()实例理解：

针对PICA的具体理解：

以下可理解为K*K的PUI中的某一行所对应的损失：

在这里插入图片描述其中x可以理解为K*K的PUI中的某一行；cluster_index即指代在该行中所对应的元素；分母部分即为该行的所以元素进行累加和。

CrossEntropyLoss(input, target)

1.

input:
entroy=nn.CrossEntropyLoss()
input=torch.Tensor([[-0.7715, -0.6205, -0.2562],
                    [-0.7715, -0.6205,  -0.2562],
                    [-0.7715, -0.6205,  -0.2562]])
target = torch.tensor([0, 0, 0])
# target = torch.arange(3)
output = entroy(input, target)
print(output)

output : tensor(1.3447)

target对应某所得特征向量中第某个待求元素。

(1)
-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.7715 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.3447
(2)
-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.7715 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.3447
(3)
-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.7715 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.3447

loss = [(1) + (2) + (3)] /3 = 1.3447

2.

input:
entroy=nn.CrossEntropyLoss()
input=torch.Tensor([[-0.7715, -0.6205, -0.2562],
                    [-0.7715, -0.6205,  -0.2562],
                    [-0.7715, -0.6205,  -0.2562]])
target = torch.tensor([1, 1, 1])
# target = torch.arange(3)
output = entroy(input, target)
print(output)

output : tensor(1.1937)

(1)
-x[1] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.6205 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.1937
(2)
-x[1] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.6205 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.1937
(3)
-x[1] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.6205 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.1937

loss = [(1) + (2) + (3)] / 3 = 1.1937

3.

input:
entroy=nn.CrossEntropyLoss()
input=torch.Tensor([[-0.7715, -0.6205, -0.2562],
                    [-0.7715, -0.6205,  -0.2562],
                    [-0.7715, -0.6205,  -0.2562]])
target = torch.tensor([2, 2, 2])
# target = torch.arange(3)
output = entroy(input, target)
print(output)

output ：tensor(0.8294)

(1)
-x[2] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.2562 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 0.8294
(2)
-x[2] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.2562 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 0.8294
(3)
-x[2] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.2562 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 0.8294

loss = [(1) + (2) + (3)] / 3 = 0.8294

4.

input:
entroy=nn.CrossEntropyLoss()
input=torch.Tensor([[-0.7715, -0.6205, -0.2562],
                    [-0.7715, -0.6205,  -0.2562],
                    [-0.7715, -0.6205,  -0.2562]])
target = torch.tensor([0, 1, 2])   # 或 target = torch.arange(3)
# target = torch.arange(3)
output = entroy(input, target)
print(output)

output ：tensor(1.1226)

(1)
-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.7715 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.3447
(2)
-x[1] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.6205+ log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.1937
(3)
-x[2] + log(exp(x[0]), exp(x[1]), exp(x[2])) =
0.2562 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 0.8294

loss = [(1) + (2) + (3)] / 3 = 1.1226

充实而又快乐

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
2020-12-19 nn.CrossEntropyLoss()

nn.CrossEntropyLoss()实例理解：N*K中的某一行所对应的单个损失：1.(1)-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =0.7715 + log(exp(-0.7715) + exp(-0.6205) + exp(-0.2562)) = 1.3447(2)-x[0] + log(exp(x[0]), exp(x[1]), exp(x[2])) =0.7715 + log(exp(-0.7715) + exp(-0.620
复制链接

扫一扫

专栏目录