学习第一步:报名赛事!(点击即可跳转)
赛事链接:https://tianchi.aliyun.com/competition/entrance/532251
天池Better Synth多模态大模型数据合成挑战赛 是 Datawhale 2024 年 AI 夏令营第四期的学习活动——
-
适合想 入门并实践 多模态大模型、数据处理、模型训练 的学习者参与
温馨提示:本赛事需要耗费大量的算力,跑通此baseline至少需要120G内存以上的A10,整个流程可能需要5小时,大家请自备算力,预留好时间,下面我们会以阿里云为例。
学习内容提要:使用已有大模型和技术,在限定的计算资源下合成高质量训练数据,以增强多模态大模型的图像理解能力。
300 分钟 baseline指南!
我们整个学习活动,将带你 ——
-
跑通最简单的Baseline(相信我,当前baseline已经写到最简单了,但需要的算力和学习实在不是常人&免费方案能hold住的)
-
了解竞赛核心考察点和难点
-
精读Baseline与了解进阶思路
当前环节目标: 300分钟 跑通 “天池Better Synth多模态大模型数据合成挑战赛” !
PS:从零入门多模态大模型数据合成-autodl版本正在整理中
千里之行,始于足下,从这里,开启你的 AI 学习之旅吧!
Step0:开通阿里云PAI-DSW试用
开通免费试用
-
在魔搭社区进行授权
链接:https://www.modelscope.cn/my/mynotebook/authorization