多模态大模型 | EVA-CLIP 蒸馏版的CLIP,效果非常好哦

🐧大模型系列篇章

💖 多模态大模型 🔎 GroundingDINO 论文总结
💖 端到端目标检测 🔎 从DETR 到 GroundingDINO
💖 多模态大模型 👉 CLIP论文总结
💖 多模态大模型 👉 EVA-CLIP
💚 生成模型 👉 从 VAE 到 Diffusion Model (上)
💚 生成模型 👉 从 VAE 到 Diffusion Model (下)
💧 天气大模型

欢迎订阅专栏,第一时间掌握最新科技
专栏链接


在这里插入图片描述

一,Abstract & Introducation

  • EVA-CLIP: 一系列显著的提升CLIP训练时的效率和有效性。
  • 用最新的表征学习, 优化策略,增强 使得EVA-CLIP在同样数量的参数下比之前的CLIP模型要好,且花费更小的训练资源。
    • pre-trained EVA 来初始化CLIP的训练
    • the LAMB optimizer
    • randomly deopping input tokens
    • speedup trick: flash attention
  • 在ImageNet-1k val的成绩
    • 82% zero-shot accuracy = EVA-02-CLIP-E/14 (5.0B-parameter)+ 9 biilion samples
    • 80.4% zero-shot accuracy = EVA-02-CLIP-L/14 (430 million paramters) + 6 billion samples

二,Approach

  • Better Initialization: pre-trained EVA weights to initializa the images encoder of EVA-CLIP
  • Optimizer: LAMB, 为large-batch training设计的优化器。 its adaptive elementwise updating and layer-wise learning rates enhance training efficiency and accelerate convergence rates
  • FLIP: we randomly mask 50% image tokens during training esulting in a significant reduction of time complexity by half.

三,Experiments

Settings

  • Datasets: 2B = 1.6 billion (LAION-2B) + 0.4 billion (COYO-700M)
  • 实验结果一目了然在这里插入图片描述
    在这里插入图片描述

🐤 论文的链接:https://arxiv.org/pdf/2303.15389.pdf

四,使用教程

安装库

pip install open_clip_torch

查看预训练好的模型集合

>>> import open_clip
>>> open_clip.list_pretrained()

🐤

亲测,eva_clip的效果要比clip原始的模型要好很多!

你也可以访问这个链接,查看都支持哪些模型 🐤

https://github.com/mlfoundations/open_clip/blob/main/docs/model_profile.csv

运行

import torch
from PIL import Image
import open_clip

model, _, preprocess = open_clip.create_model_and_transforms('ViT-B-32', pretrained='laion2b_s34b_b79k')
model.eval()  # model in train mode by default, impacts some models with BatchNorm or stochastic depth active
tokenizer = open_clip.get_tokenizer('ViT-B-32')

image = preprocess(Image.open("docs/CLIP.png")).unsqueeze(0)
text = tokenizer(["a diagram", "a dog", "a cat"])

with torch.no_grad(), torch.cuda.amp.autocast():
    image_features = model.encode_image(image)
    text_features = model.encode_text(text)
    image_features /= image_features.norm(dim=-1, keepdim=True)
    text_features /= text_features.norm(dim=-1, keepdim=True)

    text_probs = (100.0 * image_features @ text_features.T).softmax(dim=-1)

print("Label probs:", text_probs)  # prints: [[1., 0., 0.]]

使用的是open_clip的库,很好用哦!这是官方仓库的链接:https://github.com/mlfoundations/open_clip

有什么问题,请评论留言哦~ 🎶

  • 13
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《pcap04-eva-kit-manual.pdf》是一份关于pcap04-eva套件的使用手册。该手册详细介绍了如何正确使用pcap04-eva套件以及相关工具和软件。 首先,手册提供了该套件的概述,包括其基本组成部分和主要功能。它还介绍了与套件一起提供的所有配件和连接器,以便用户能够了解套件的整体结构。 其次,手册提供了关于套件的安装和设置的详细步骤。它包括如何正确连接电缆和插头以及如何将套件与计算机或其他设备连接起来。手册指导用户如何安装套件的驱动程序和软件,以确保套件可以正常工作。 此外,手册提供了使用套件进行数据采集和分析的详细说明。它介绍了如何配置套件以捕获网络数据包,并提供了一些常见问题的解决方案和调试技巧。手册还简要介绍了套件支持的其他功能,例如网络分析和性能监测等。 最后,手册提供了一些使用套件时的最佳实践和建议。它包括了一些实用的技巧和注意事项,以确保用户可以充分利用套件的功能和性能。 总之,《pcap04-eva-kit-manual.pdf》是一份详尽的使用手册,旨在帮助用户正确使用pcap04-eva套件。它提供了从安装到数据采集和分析的全面指导,使用户能够快速上手并充分发挥套件的潜力。 ### 回答2: "pcap04-eva-kit-manual.pdf" 是一份关于PCAP04评测套件的使用手册。PCAP04评测套件是一种用于评估触摸屏性能的工具。这份手册提供了使用指南,以帮助用户了解如何设置和操作PCAP04评测套件。 手册中首先介绍了PCAP04评测套件的概述,包括套件内的部件和其主要功能。接着详细说明了安装和配置套件的步骤,包括所需的软件和硬件设备。用户可以按照手册中的说明,逐步进行安装和设置。 手册还介绍了使用套件进行触摸屏评估的方法。它详细解释了评估过程中所需的各种设置选项和参数,以及如何根据评估的目的和需求进行选择。此外,手册还提供了一些相关的背景知识和理论,以帮助用户更好地理解评估结果。 最后,手册还包含了一些故障排除指南和常见问题解答,以帮助用户在遇到问题时进行解决。 通过阅读并遵循这份手册,用户可以更好地理解和使用PCAP04评估套件,从而评估和改进触摸屏的性能。手册提供了详细的说明和指导,以帮助用户更好地使用这一评估工具,提升产品的质量和用户体验。 ### 回答3: 《pcap04-eva-kit-manual.pdf》是一本关于PCAP04评估套件的操作手册。PCAP04评估套件是一种用于评估和测试PCAP04传感器模块性能的工具。手册提供了详细的使用说明和操作步骤,以帮助用户正确安装、配置和操作评估套件。 手册的内容包括评估套件的硬件和软件设置、连接说明、电源和接地要求等。它还介绍了如何使用套件进行各种测试,例如读取传感器数据、调整采样率和灵敏度、校准传感器等。手册还提供了解决常见问题的方法和故障排除的步骤,以确保用户能够顺利进行评估和测试工作。 《pcap04-eva-kit-manual.pdf》是一份非常有用的文档,可以帮助用户快速了解和使用PCAP04评估套件。无论是新用户还是有经验的用户都可以通过阅读手册掌握评估套件的操作技巧,并准确有效地进行测试和评估工作。通过合理正确地使用评估套件,用户可以充分发挥PCAP04传感器模块的性能,并提供高质量的数据和结果。 总之,该手册是PCAP04评估套件的重要参考资料,对于用户来说具有很高的实用价值。通过仔细阅读并按照手册上的操作步骤进行操作,用户可以顺利地完成评估工作,并获得准确可靠的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值