以文搜图，多种语言也不成问题（CLIP 支持中文）

M.Jael

已于 2022-08-03 16:11:20 修改

阅读量2.7k

点赞数 2

文章标签： python 人工智能深度学习计算机视觉 pytorch

于 2022-07-20 16:24:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52898169/article/details/125892860

版权

本文介绍了如何使用CLIP模型进行跨模态图文检索，特别是如何利用支持中文的预训练模型进行以文搜图。通过Towhee库，可以方便地实现多语言CLIP模型的安装和应用，包括图片和文本的编码以及相似度判断。

摘要由CSDN通过智能技术生成

以文搜图是跨模态图文检索的一部分，那么什么是跨模态图文检索？说的通俗易懂，就是实现文字和图片两种不同格式数据之间的互相搜索，通过文字描述找到最符合的图片，或者搜寻最适合图片的文字描述。不同于通过标签将文本和图片关联起来，跨模态模型能够从语义或内容含义的角度匹配不同类型的数据，这种检索方式更接近人为判断，更加“人工智能”。

如今最热门的跨模态文本图片模型莫过于 CLIP，推荐一些原理详解和基于 CLIP 搭建文本图片搜索系统的教程：从零到一，教你搭建「以文搜图」搜索服务（一）_Zilliz Planet的博客-CSDN博客_以文搜图和从零到一，教你搭建「CLIP 以文搜图」搜索服务（二）：5 分钟实现原型_Zilliz Planet的博客-CSDN博客。我这里就不进行赘述了，接下来主要介绍大家很关心的一个问题：是否有预训练好的多语言 CLIP 模型？更直白一些，能用中文搜图片吗？

先上代码：

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
以文搜图，多种语言也不成问题（CLIP 支持中文）

简单的代码实现以文搜图，多语言预训练模型，支持中文。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。