SuperGlue学习记录之最优传输

在进行最优传输相关理论的学习过程中,找到SuperGlue这篇论文,该篇论文通过最优传输来完成特征点的匹配过程。

SuperGlue结构

在这里插入图片描述
先来看一下其结构:

首先将两张图片送入特征提取网络,通过卷积网络提取出特征,主要有四个值,分别是两张图片的特征信息,diA与diB(1,256,997),256是维度特征,以及位置信息piA与piB(1,997,2) 997指的是图像中的特征点数目,2指的是xy坐标。
随后将特征点位置送入KeyPoint Encoder中进行维度转换,变为(1,256,997)与(1,256,1074),随后送入AGNN(Attentional Graph Neatural Network),该模块是借鉴于Transformer,进行自注意力与交叉注意力计算,最终获取两个图像的特征,分别为(1,256,1074)与(1,256,997),随后使用两个特征信息计算score,具体计算方式为:

mdesc0, mdesc1 = self.final_proj(desc0), self.final_proj(desc1)
# Compute matching descriptor distance.
scores = torch.einsum('bdn,bdm->bnm', mdesc0, mdesc1)

即求得值为Sij,随后借鉴于SuperPoint,引入dustbin,是为了处理没有匹配上的特征点,由此构成了代价矩阵,将构造的代价矩阵送入Sinkhorn算法中进行运算,最终得到传输计划与损失值。

下图为数据变换与模型结构图。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭祥.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值