VLM小模型元年!提示学习驱动知识蒸馏新方法 | CVPR'24

自从谷歌提出ViT、Open AI发布CLIP,视觉语言模型(VLM)便成为了研究热点,凭借跨模态处理和理解能力,以及零样本学习方法,为CV领域带来了重大革新,但由于大模型体量及泛化的限制,今年多家巨头开启了模型压缩技术的角逐,其中,知识蒸馏的教师-学生模型效果显著,一项基于提示学习的VLM蒸馏新方法,也被顶会CVPR'24关注收录

5652c2e2e771ecf588d8b31296d8c793.png

为了帮助大家综合掌握,集VLM、知识蒸馏、提示工程一体的创新成果,研梦非凡于9月4日晚(周三),邀请了从事多模态大模型研究的王导师,独家详解来自南开&蚂蚁集团的CVPR'24研究《PromptKD:基于提示学习的VLM蒸馏新方法!(AI前沿直播课NO.65),从VLM、Knowledge Distillation、Prompt Learning的知识回顾,到PromptSRC等顶会相关工作,重点讲解PromptKD方法原理、提示蒸馏过程及实验研究,1节课get前沿视野及论文idea!

👇🏻扫描二维码找助教0元预约直播课!

c4cd56abcebd8d85738db3c7d55d966c.png

凡预约即可免费领取300篇精选论文(50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM+文末还有算力等科研福利!

e95dd98e68ccd238cbb436642c688064.gif

unsetunset直播课内容概览unsetunset

01 研究背景

  1. 关注的问题

  2. 本文主要贡献

  • 无监督领域特定提示驱动知识蒸馏

  • 预存储文本特征

  • 教师-学生范式

  • 广泛的实验验证

02 知识准备

  1. 视觉语言模型(VLM)

  • 经典模型CLIP介绍

  • CLIP特点与架构

  1. 知识蒸馏(Knowledge Distillation)

  • 什么是知识蒸馏?

  • 为什么要知识蒸馏?

  • 知识蒸馏的原理:Teacher、Student模型

  • 知识蒸馏的分类:基于目标、基于特征的蒸馏

  1. 提示学习(Prompt Learning

  • Prompt-Tuning的优缺点

  • Prompt-Tuning的代表性工作

👇🏻扫描二维码找助教0元预约直播课!

6998e97833b7a1553e2382e6475a58f4.png

凡预约即可免费领取300篇精选论文(50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM+文末还有算力等科研福利!

03 相关工作

  1. PromptSRC(ICCV'23)

  • 简介:自我调节的提示学习框架,解决了提示过拟合问题,以实现更好的泛化

  • 框架原理

04 PromptKD详解(CVPR'24)

  1. 方法简介

  2. 两阶段训练流程

  • Prompt Learning

  • 通过促进快速模仿来启动蒸馏过程,鼓励学生模型生成与教师模型相似的预测

  1. 伪代码

05 实验研究

  1. 实验一

  • 实验指标、数据集等

  • 实验设置

  1. 实验二

  • 实验流程

  1. 消融实验

06 总结和展望

导师介绍

王导师

【学术背景】985硕出身,拥有丰富的深度学习研究、论文发表经验,多篇SCI论文、EI会议论文(一作)

【研究方向】大语言模型、视觉语言模型、多模态学习,以及自然语言处理、进化算法等

👇🏻扫描二维码找助教0元预约直播课!

8773007dd351ba8bac5ae4fc3191f784.png

凡预约即可免费领取300篇精选论文(50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM+文末还有算力等科研福利!

unsetunset研梦非凡科研论文指导方案unsetunset

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

7d208e1a24e13fbf271f20ad8e54ef01.jpegff0e2047b53dfb586577300886bb125f.jpeg

<<< 左右滑动见更多 >>>

👇🏻扫描二维码咨询助教两种指导方案

9bf6dbe335549d23c275547a37f963a7.png

unsetunset研梦非凡部分导师介绍unsetunset

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~

7d66af2f5b27055eee5108289d12df10.png08fab17a0309564930700c8f851818c1.pngb12a87295cbc67e81b663d2e19191795.pnga1638d90cd95cacda07513af46b4f3c9.png

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

f47a4449f41cbb8baaf802878cfd2e24.png

unsetunset研梦非凡科研福利unsetunset

🌟90分钟人工智能零基础入门课免费领

🌟7小时科研论文写作系列课免费领

🌟年度会员福利价129元(原价2999)

🌟50小时3080GPU算力免费领

🌟百篇8月论文资料大合集免费领

👇🏻 扫码领取以上5重粉丝专属科研福利!

3146fce4636fad55c71098a397ff6e53.png

b7e5fa7fc00cfc9ea946c7133edc4400.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当然,我可以给你提供一些 VLM (Visual Light Communication) 和 LLM (Low Level Message) 的代码示例。以下是一个简单的VLM代码示例: ```python import time import RPi.GPIO as GPIO # 设置GPIO引脚 LED_PIN = 18 # 初始化GPIO GPIO.setmode(GPIO.BCM) GPIO.setup(LED_PIN, GPIO.OUT) def transmit_message(message): for char in message: # 将字符转换为二进制 binary = bin(ord(char))[2:].zfill(8) # 发送二进制信号 for bit in binary: if bit == '1': GPIO.output(LED_PIN, GPIO.HIGH) else: GPIO.output(LED_PIN, GPIO.LOW) # 控制发送速度(根据实际情况调整) time.sleep(0.1) # 两个字符之间的间隔时间(根据实际情况调整) time.sleep(0.5) # 发送消息 transmit_message("Hello, World!") # 清理GPIO资源 GPIO.cleanup() ``` 这个示例使用树莓派的GPIO引脚来模拟光通信,通过控制LED的亮灭来传输二进制信号。 以下是一个简单的LLM代码示例,这里假设你是在C语言环境下进行开发: ```c #include <stdio.h> #include <string.h> // 定义消息缓冲区大小 #define BUFFER_SIZE 100 void process_message(char* message) { // 在这里实现对消息的处理逻辑 printf("Received message: %s\n", message); } int main() { char buffer[BUFFER_SIZE]; // 模拟接收消息 printf("Enter a message: "); fgets(buffer, BUFFER_SIZE, stdin); // 去除换行符 buffer[strcspn(buffer, "\n")] = '\0'; // 处理消息 process_message(buffer); return 0; } ``` 这个示例是一个简单的命令行程序,通过用户输入来模拟接收消息,并在控制台上输出收到的消息。 希望这些示例能对你有所帮助!如果你有任何其他问题,可以继续问我。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值