跨模态神经搜索实践VCED CLIP简介

1. CLIP简介

1.1 CLIP是什么

CLIP(Contrastive Language-Image Pretraining)模型将原有的图像标签替换为图像的文本描述信息,来监督视觉任务的训练,在下游任务中得到了较好的zero-shot结果。

该模型将图像分类问题转换为图文匹配问题,首先针对图片构造text prompt,并使用CLIP模的text encoder获得文本编码向量,之后将图片通过image encoder获得图像编码向量。

对于图片,计算它与所有text prompt之间的距离(图像编码向量与文本编码向量的余弦相似度/点积),选择距离最近的text prompt标签作为图片的标签。

除此之外,CLIP模型可广泛应用到图像检索、视频理解、图像生成等其它领域。

1.2 CLIP原理

CLIP将语言信息和图像信息联合训练,实现了在下游任务上zero-shot(Zero-shot learning指没有当前类别的训练样本的情况下,让模型学习到一个映射关系可以将样本映射到原有的向量空间,再通过距离判断当前样本可能属于哪一个类别)的能力。

  • 训练过程

具体而言,即收集N个图像和文本对,将其按照编码次序排列,可以得到一个N*N矩阵T,训练需要使得对角线上的元素值尽可能大,其余部分值尽可能小,矩阵中的T(i, j)表示第i个文本与第j个文本图像之间的语义相似度。

  • zero-shot过程

根据上下文语义建立prompt模板,将分类标签映射到prompt模板得到文本集合&#

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VCED Docker是一种部署VCED项目的方式,通过使用Docker容器化技术,可以方便地在不同的环境中运行VCED项目。引用和提供了使用Docker镜像快速启动VCED项目的方法。首先,进入项目文件夹,然后执行docker-compose build命令来构建Docker镜像,接着执行docker-compose up -d命令来启动VCED项目。这样就可以通过指定的接口访问VCED。可以使用docker ps -a命令查看当前拥有的所有镜像,并通过docker port命令查看指定镜像的接口信息。在VCED中,默认的接口为8501。因此,可以通过个人IP地址加上接口来访问VCED。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [VCED环境的配置及安装](https://blog.csdn.net/wjie0309/article/details/127895564)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [DataWhale-VCED项目学习-1安装](https://blog.csdn.net/uncle_ll/article/details/127852930)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值