使用Qdrant + CNCLIP + Gradio 实现图文检索

最新推荐文章于 2024-10-04 11:19:03 发布

ToTensor

最新推荐文章于 2024-10-04 11:19:03 发布

阅读量484

点赞数 5

分类专栏：随笔文章标签：自然语言处理人工智能

本文链接：https://blog.csdn.net/qq_44193969/article/details/141891209

版权

随笔专栏收录该内容

10 篇文章 3 订阅

订阅专栏

使用Qdrant + CNCLIP + Gradio 实现图文检索

效果
请添加图片描述

1、数据准备

下载链接：图文检索图片数据

import base64
import pandas as pd
from io import BytesIO
from PIL import Image
import os

data_path = "./data/MR_valid_imgs.tsv"
save_dir = "./data/images"

if not os.path.exists(save_dir):
    os.makedirs(save_dir)

data = pd.read_csv(data_path, header=None, sep='\t')

for index, row in data.iterrows():
    image_id = row[0]
    image_data = row[1]

    img = Image.open(BytesIO(base64.urlsafe_b64decode(image_data)))
    img.save(os.path.join(save_dir, f"{image_id}.png"))

利用以上代码将图片和图片base64数据保存为本地png图片

2、安装依赖

1、首先安装cn_clip

因为官方仓库有一点小bug，所以从我fork后的仓库安装

git clone https://github.com/seanzhang-zhichen/Chinese-CLIP.git
cd Chinese-CLIP
pip install -e .

注意： 必须得从源码安装，否则会报错缺少配置文件

2、安装其它依赖

pip install -r requirements.txt

3、启动web demo

python web_demo.py

其它

如果想使用 tensorrt 推理，安装 tensorrt==8.6.1 版本即可（已测试），会比torch快很多

全部代码：https://github.com/seanzhang-zhichen/image-text-retrieve/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ToTensor

关注关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【深度学习】Chinese-CLIP 使用教程，图文检索，跨模态检索，零样本图片分类

q742971636的博客

10-09

2423

【代码】【深度学习】Chinese-CLIP 使用教程，图文检索，跨模态检索，零样本图片分类。

CLIP与Chinese-CLIP：多模态预训练模型解读和图文检索体验

梦坠凡尘

07-03

9884

CLIP是2021年OpenAI提出的基于图文对比学习的多模态预训练模型，具备强大的zero-shot迁移能力。数据集：来源于互联网上搜集的4亿个image-text对，涵盖了50万个qurey，并尽量保持不同qurey的数据量均衡。核心思想：将image-text对当做一个整体，基于对比学习的方法，模型训练时尽可能地提高image与对应text的特征相似度，尽可能的降低image与不配对text的相似度。

参与评论您还未登录，请先登录后发表或查看评论

Chinese-CLIP使用教程

m0_63213284的博客

04-27

1694

1.用Make_json.py将xlsx里的文本转换成json格式（对于测试集只有文本，不知道图文对匹配关系的情况，每行的image_ids字段处理为空列表即可，即"image_ids": []）；用Img2base64将图片编码成base64格式（.tsv文件）2.用build_Imdb_dataset.py把.tsv和.json文件转换为内存索引的LMDB数据库文件2.5.对模型进行finetune(微调)。（可以不进行，直接用预训练模型）

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

呆呆的猫的博客

05-20

7299

本文主要介绍 Chinese CLIP

clip安装使用教程（24-7-11更新，包括虚拟环境下的安装和使用）

yxx35AN的博客

01-16

4324

注：刚开始直接运行代码报错，Can't load tokenizer for 'openai/clip-vit-base-patch32'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name. 依靠上述方法解决，类似的报错都可以依靠上述方法解决，直接下载本地文件然后放入对应的文件夹就行。

Chinese-CLIP安装与配置完全指南

gitblog_09385的博客

09-13

428

Chinese-CLIP安装与配置完全指南 Chinese-CLIP 针对中文场景下设计和构建的CLIP模型变体，它能够完成跨视觉与文本模态的中文信息检索，并能够生成有效的多模态表示。这样的工具主要用于提升人工智能系统对于不同模态（如图像和文本）数据的理解、关联与检索能力。 ...

基于yolov8+deepsort+gradio实现目标追踪演示源码

09-22

具体实现细节和效果参考博文：https://blog.csdn.net/FL1623863129/article/details/142438034

【YOLOv8实战】手把手带你入门YOLOv8，你也能训练自己的检测器，以SAR目标检测为例（源码+数据集+Gradio界面）

04-11

本次分享将带领大家熟练掌握 YOLOv8 的使用，并根据自己的任务训练一个特定场景的检测器，本文将重点讲解 YOLOv8 训练框架中数据集的格式、配置文件等细节，让小白少走弯路，跟着走就能轻松训练好自己的检测器，并...

使用LangChain调用Gadio工具，并且建立Gradio页面

05-29

使用LangChain调用Gadio工具，并且建立Gradio页面包含使用Langchain建立gpt agent 使用Langchain让GPT自动调用工具将输入输出透过Gadio生成可视化页面公网调用接口

基于yolov10+gradio实现药丸检测系统源码+模型+数据集.7z

06-03

本项目利用深度学习框架中的Yolov10算法，并结合Gradio交互式工具，实现了对药丸的实时检测系统。下面，我们将深入探讨这一系统的实现细节。一、Yolov10简介 YOLO（You Only Look Once）是目标检测领域的热门算法...

基于Gradio的YOLOv8通用目标检测与图像分割演示系统

04-24

- `gradio_app.py`：使用Gradio构建的用户界面代码，负责接收用户输入和显示预测结果。 - `weights`目录：存储YOLOv8模型的预训练权重文件。 - `requirements.txt`：列出所有必要的依赖库和版本，用于环境配置。 - ...

多模态表征—CLIP及中文版Chinese-CLIP：理论讲解、代码微调与论文阅读

小小帅

02-26

9459

1.讲解CLIP的主要内容；2.讲解Chinese-CLIP的主要内容；3.CLIP/Chinese-CLIP代码微调；4.CLIP/Chinese-CLIP论文重点阅读

【Milvus的以文搜图】

hello_dear_you的博客

11-28

5804

基于中文CLIP和Milvus实现以文搜图应用

clip的安装步骤

使用Qdrant + CNCLIP + Gradio 实现图文检索

使用Qdrant + CNCLIP + Gradio 实现图文检索

1、数据准备

2、 安装依赖

3、启动web demo

其它

2、安装依赖