论文 :TransGeo: Transformer Is All You Need for Cross-view Image Geo-localization
代码:https: //github.com/Jeff-Zilence/TransGeo2022.
论文大概:本文充分利用了transformer的全局信息建模和显著位置编码优势,并利用注意力引导的非均匀编码技术对图像的无用信息进行了去除,保留了有用信息,进而可以使多余的计算成本用于计算高分辨率的图像,实验表明,我们在城市和农村的数据集上都达到了sota水准。
由于本人之前已经读过这篇论文,因此下面直接开始代码实战 。
第一步:配置环境
下载代码以后,按照readme要求 ,需要安装的包版本如下:
Python >= 3.6
numpy
matplotlib
pillow
ptflops
timm
PyTorch >= 1.8.1
torchvision >= 0.11.1
上次的代码还在训练,电脑有点慢,卡住了等训练完在更新这个的代码复现