OpenSeeD:A Simple Framework for Open-Vocabulary Segmentation and Detection这篇工作发布在2023年的ICCV上,这是一个简单的开放词汇分割和检测框架,它可以从不同的分割和检测数据集中联合学习。为了弥补词汇和注释粒度的差距,我们首先引入了一个预先训练的文本编码器,对两个任务中的所有视觉概念进行编码,并为它们学习一个公共的语义空间。
一、代码复现–配置环境
1.安装包torchmetrics==0.6.0失败的解决方法
命令:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchmetrics==0.6.0
2.安装包timm==0.4.12失败的解决方法
命令:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple timm==0.4.12
3.安装包pycocotools==2.0.4,出现错误 ERROR: Could not build wheels for pycocotools, which is required to install pyproject.toml-based projects的解决方法
(1)下载如下pycocotools压缩包
链接:https://pan.baidu.com/s/1zyIX_VrFXNNdkV3ZsIOAjQ
提取码: