视觉大模型的幻觉挑战!原因梳理、方法总结!

近年大模型彻底火了,但随之而来的幻觉问题,即多模态大模型生成的内容,与现实世界或者用户输入出现不符,引发了学业界的担忧,并开始围绕其产生原因、检测机制、缓解方法等,展开了全面而深入的研究,CVPR'24也收录了一批关于幻觉问题的工作,在数据、基准、解码等多个层面,创新方法层出不穷!

b943b44edc18533dbba4aab47f4b89c5.png

为了帮助大家掌握幻觉缓解顶会方法,研梦非凡于8月21日晚(周三),邀请了从事多模态大模型研究的王导师,独家详解阿里&南洋理工CVPR'24最新工作《LVLMs对象幻觉的缓解:视觉对比解码(VCD)》(AI前沿直播课NO.62)从LVLMs面临的挑战、对象幻觉问题,再到幻觉产生原因、缓解办法,重点讲解VCD核心原理,并具体演示代码,1节课速通大模型幻觉,收获论文idea、求职面试知识点!

👇🏻扫描二维码找助教0元预约直播课!

e48a82c89a4d5818de3f9517573a4e77.png

凡预约即可免费领取200篇相关论文(20篇幻觉前沿+70篇多模态+120篇大模型+文末还有算力等科研福利!

d2ba96283b2d07b2ceb6debc72693f33.gif

直播课内容概览

01 研究背景

  1. LVLMs的对象幻觉问题

  • 对象幻觉的概念和影响

  • 易受影响的场景和行业

  1. LVLMs面临的挑战

  • 根本性问题

  • 缓解问题的新方法VCD

  • VCD减少对象幻觉的原理

02 相关工作

  1. 多模态幻觉的含义

  2. 多模态幻觉产生的原因

  • 数据:数据量不足、数据质量问题、缺乏多样性

  • 视觉编码器:有限的视觉分辨率、细粒度视觉语义不足

  • 连接模块:简单结构、有限的标记约束

  • LLM:不足的上下文注意力、随机采样解码

  1. 缓解幻觉的方法

  • 数据优化

  • 视觉编码器增强

  • 连接模块改进

  • LLM的解码优化

  • 后处理方法

03 VCD方法详解(重点)

  1. 视觉语言模型的解码

  2. 视觉不确定性加剧幻觉

  • 视觉不确定性会放大语言先验

  • 视觉不确定性会放大统计偏差

  1. 视觉对比解码

  • 设计目的

  • 对比预测

  • 自适应合理性约束

04 实验分析

  1. 实验设置和结果

  2. 数据集基准:POPE & MME

05 代码实现(重点)

  1. 核心代码讲解

  2. 具体演示

    12a8abd37d4a732b41940d02190c1870.png

06 总结和展望

直播福利

参加本次直播的同学都将获得1小时导师meeting的福利(助教+导师)!原价2999,限时福利价9.9元活动时间为8月21日到8月31日。

ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松完成论文报告。

👇🏻扫描二维码找助教0元预约直播课!

40ac2b7b489fcbd4b8f7e373c422d40f.png

凡预约即可免费领取200篇相关论文(20篇幻觉前沿+70篇多模态+120篇大模型+文末还有算力等科研福利!

研梦非凡科研论文指导

如果你的研究方向/方法/idea是属于CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向,如果你需要发CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等,都可以来研梦非凡,匹配合适的科研指导。

研梦非凡可指导的研究方向

bf73aa6399a068c07de3ec190cc4caf0.jpeg

主流方向科研论文常用方法

b5d8f4fd4eca662bf5362cc5419c378c.jpeg

研梦非凡现有idea

b58649202edd0d1557fe14fa1f95d89a.png

👇🏻扫码找助教了解更多/验证自己的idea是否可行

2549b51b0bef4fedf379e9320c8cee2b.png

研梦非凡科研论文指导方案

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

f8620cbcd1f5fd404074612b1b1f97c7.jpeg567b498614cc388f354f62bd325fb2df.jpeg

<<< 左右滑动见更多 >>>

👇🏻扫描二维码咨询助教两种指导方案

0b651711a3401257fdd1bf276df7fcdc.png

研梦非凡部分导师介绍

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~

ed6d6cbb82ea7431459c8a4f24978718.png59b9a87a61a4d5ba12b445de5f55e573.png41693a0c9f82ab5bc4c8b04a028a097c.pngd1bf7f99fb38de6d86d44642c9ed28cf.png

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

eb0ffd31ba945671b833e272996a0cf7.png

研梦非凡科研福利

🌟90分钟人工智能零基础入门课免费领

🌟7小时科研论文写作系列课免费领

🌟数十节前沿论文直播课程免费领

🌟50小时3080GPU算力免费领

🌟百篇8月论文资料大合集免费领

🌟报名本次直播课,9.9元即可享受原价2999元的1小时导师meeting(助教+导师)! 

👇🏻扫码领取以上6重粉丝专属科研福利!

94acb4b56b05668450583508138f811e.png

fb3da21333b052b5c8aa76f137a9505d.jpeg


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值