大模型讲习班丨智源研究员王鑫龙：从视觉到多模态基础模型

智源社区

于 2023-10-17 17:31:09 发布

阅读量314

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247541706&idx=2&sn=9256c01b2b889863b391b355269464ec&chksm=febc600ec9cbe918bf860299a56f794f80366506ca60bd6b8e0f095d1971104632f5a83a156c&scene=126&sessionid=0

版权

人工智能研究与应用范式正经历一场剧变，越来越多的顶级团队和杰出人才纷纷加入这一变革浪潮。作为AI大模型科研先锋，智源研究院携手一批卓越的学者与工程师，致力于将尖端技术与经验传授给有潜力的学习者，通过高效的学习方式，让更多人能迅速融入这一重要的历史进程，提升中国在这一领域的人才数量和质量。

大模型前沿技术讲习班第一季第四期（S01E04）将在 2023年10月28日至29日于智源大厦（北京市海淀区成府路150号）召开，本期主题聚焦于“智源FlagOpen大模型开源体系与应用”。本次讲习班将由智源研究院9位研究员担纲介绍 FlagOpen 的近期进展以及落地实践。

其中，10月29日上午10:40-11:40智源研究员王鑫龙将讲授《从视觉到多模态基础模型》。

专家介绍

王鑫龙, 智源研究院视觉模型研究中心负责人。本科毕业于同济大学，博士毕业于澳大利亚阿德莱德大学，师从沈春华教授。他的研究兴趣是计算机视觉和基础模型，近几年研究工作包括视觉感知（SOLO, SOLOv2），视觉表征 (DenseCL, EVA)，视觉通才模型(Painter, SegGPT)，多模态表征(EVA-CLIP)，多模态通才模型(Emu)。曾获Google PhD Fellowship和阿德莱德大学博士研究奖章。

课程内容

语言基础模型率先取得突破，如何构建通用的视觉和多模态基础模型，成为现在视觉领域关注的热点问题。本次报告将围绕视觉上下文学习、图文对比学习、生成式多模态预训练等技术，介绍大规模视觉表征、通才视觉模型、通才多模态模型等最新研究进展和应用实践。

课程提纲

基础算法
1. 图文对比学习
2. 上下文视觉学习
3. 生成式多模态预训练
应用实践
1. EVA-CLIP在开放视觉识别中的应用
2. SegGPT 分割模型使用实践
3. Emu在多模态理解和生成中的应用

欢迎扫码查看更多精彩议题和了解报名详情

智源社区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大模型讲习班丨智源研究员王鑫龙：从视觉到多模态基础模型

人工智能研究与应用范式正经历一场剧变，越来越多的顶级团队和杰出人才纷纷加入这一变革浪潮。作为AI大模型科研先锋，智源研究院携手一批卓越的学者与工程师，致力于将尖端技术与经验传授给有潜力的学习者，通过高效的学习方式，让更多人能迅速融入这一重要的历史进程，提升中国在这一领域的人才数量和质量。大模型前沿技术讲习班第一季第四期（S01E04）将在 2023年10月28日至29日于智源大厦（北京市海淀区成府...
复制链接

扫一扫