前言
现在要使用Pytorch中自带的
torch.nn.
CosineSimilarity函数计算两个高维特征图(B,C,H,W)中各个像素位置的特征相似度,即特征图中的每个像素位置上的一个(B,C,1,1)的向量为该位置的特征,总共有BxHxW个特征。
一、官方函数用法
意思是 dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。但是现有的大多数博客将dim的用法复杂化,因此这里进行简单的实验验证,来验证一下上述说法。
二、实验验证
1.计算高维数组中各个像素位置的余弦距离
创造高维数组,在通道维度(即dim=1)上进行向量的余弦距离计算,并查看其中第一批数据中的位置(0,0)上的两个向量之间的余弦距离:
>>> import torch
>>> import torch.nn as nn
>>> cos = nn.CosineSimilarity(dim=1, eps=1e-6)
>>> input1 = torch.randn(3, 64, 100, 128)
>>> input2 = torch.randn(3, 64, 100, 128)
>>> output = cos(input1, input2)
>>> output[0, 0, 0]
tensor(-0.1095)
2.验证高维数组中任意一个像素位置的余弦距离
将上述高维数组中的第一批数据中的位置(0,0)上的各个通道数值组成该位置上的特征向量,并计算两个向量间的余弦距离:
>>> import torch
>>> import torch.nn as nn
>>> cos2 = nn.CosineSimilarity(dim=0, eps=1e-6)
>>> input3=input1[0, :, 0, 0]
>>> input4=input2[0, :, 0, 0]
>>> output2 = cos2(input3, input4)
>>> output2
tensor(-0.1095)
发现两个距离是相同的,因此dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。
总结
Pytorch中自带的torch.nn.CosineSimilarity函数计算两个高维特征图中各个像素位置的特征相似度,其中dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。