进行 softmax 操作的公式如下:
对于给定的向量 x,softmax 函数的计算公式为:
假设我们有原始数据如下:
[[1.0, 2.0, 3.0],
[4.0, 5.0, 6.0]]
现在我们来进行计算:
对于第一行 [1.0, 2.0, 3.0]
对于第二行 [4.0, 5.0, 6.0]
:
因此,经过 softmax 操作后,数据应该为:
[[0.0900, 0.2447, 0.6652],
[0.0900, 0.2447, 0.6652]]
实际跑了一下,此时dim=1,沿着行方向。