大模型讲习班丨智源研究员王鑫龙:从视觉到多模态基础模型

123a8d1c4105f1255eb1f6c3b5eaefde.jpeg

人工智能研究与应用范式正经历一场剧变,越来越多的顶级团队和杰出人才纷纷加入这一变革浪潮。作为AI大模型科研先锋,智源研究院携手一批卓越的学者与工程师,致力于将尖端技术与经验传授给有潜力的学习者,通过高效的学习方式,让更多人能迅速融入这一重要的历史进程,提升中国在这一领域的人才数量和质量。

大模型前沿技术讲习班第一季第四期(S01E04)将在 2023年10月28日至29日于智源大厦(北京市海淀区成府路150号)召开,本期主题聚焦于“智源FlagOpen大模型开源体系与应用”。本次讲习班将由智源研究院9位研究员担纲介绍 FlagOpen 的近期进展以及落地实践。

其中,10月29日上午10:40-11:40智源研究员王鑫龙将讲授《从视觉到多模态基础模型》。

专家介绍

2eaf5650128988f23bebe73eaf98e6cf.png

王鑫龙, 智源研究院视觉模型研究中心负责人。本科毕业于同济大学,博士毕业于澳大利亚阿德莱德大学,师从沈春华教授。他的研究兴趣是计算机视觉和基础模型,近几年研究工作包括视觉感知 (SOLO, SOLOv2),视觉表征 (DenseCL, EVA),视觉通才模型(Painter, SegGPT),多模态表征(EVA-CLIP),多模态通才模型(Emu)。曾获Google PhD Fellowship和阿德莱德大学博士研究奖章。

课程内容

语言基础模型率先取得突破,如何构建通用的视觉和多模态基础模型,成为现在视觉领域关注的热点问题。本次报告将围绕视觉上下文学习、图文对比学习、生成式多模态预训练等技术,介绍大规模视觉表征、通才视觉模型、通才多模态模型等最新研究进展和应用实践。

课程提纲

  1. 基础算法

    1. 图文对比学习

    2. 上下文视觉学习

    3. 生成式多模态预训练

  2. 应用实践

    1. EVA-CLIP在开放视觉识别中的应用

    2. SegGPT 分割模型使用实践

    3. Emu在多模态理解和生成中的应用

66d8276b4f964c7d4a31f877ff53cd4b.jpeg

欢迎扫码查看更多精彩议题和了解报名详情

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值