本文来源公众号“我爱计算机视觉”,仅用于学术分享,侵权删,干货满满。
原文链接:ECCV2024 | AddressCLIP:一张图实现街道级定位,端到端图像地理定位大模型
拔草星人的好消息来啦!
中科院自动化所和阿里云一起推出了街景定位大模型,只要一张照片就能实现街道级精度的定位。
有了模型的帮助,再也不用害怕遇到种草“谜语人”了。
比如给模型看一张旧金山的街景之后,它直接给出了具体的拍摄位置,并列举了附近的多个候选地址。
该模型名为AddressCLIP,基于CLIP构建。
相关论文AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization已入选顶会ECCV2024。
传统的图像位置识别往往致力于以图像检索的方式来确定图像的GPS坐标,这种方法称为图像地理定位。
<