#Datawhale AI夏令营第4期#多模态大模型复盘

最新推荐文章于 2024-08-21 16:56:45 发布

fzyz123

最新推荐文章于 2024-08-21 16:56:45 发布

阅读量248

点赞数 9

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fzyz123/article/details/141306521

版权

这是Datawhale AI夏令营第4期多模态大模型赛道的复盘总结。本次学习最终获得了优秀学习者的称号。

本次赛事是天池Better Synth多模态大模型数据合成挑战赛。Better Synth 是一项以数据为中心的挑战赛，考察如何合成与清洗图文数据以在多模态大模型上取得更优的图片理解能力。数据集产出流程中必须包含“合成”的过程。

涉及到的知识点：

多模态大模型训练脚本
简单的Linux操作系统下的环境配置和安装
Data Jucier 与 Mini-Gemini 的学习
数据处理的进阶技巧和模型训练阶段的技巧等
Data Jucier Playground
Mini-Gemini
数据处理
官方赛事解读
自定义算子介绍
data-juicer sandbox insights讲解
上分思路

困难：

1.全数据未跑通；

2.150k数据跑完结果不对，未找到原因

3.时间、算力困难，上分思路未实践

4.data-juicer和sandbox没有深入研究

后续方向：

熟悉Data-Juicer官方文档和示例
sandbox样例研究
上分思路实践（10k模型）
多模态相关论文阅读（B站）

关注

9
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
#Datawhale AI夏令营第4期#多模态大模型复盘

这是Datawhale AI夏令营第4期多模态大模型赛道的复盘总结。本次学习最终获得了优秀学习者的称号。本次赛事是Better Synth 是一项以数据为中心的挑战赛，考察如何合成与清洗图文数据以在多模态大模型上取得更优的图片理解能力。
复制链接

扫一扫

fzyz123 CSDN认证博客专家 CSDN认证企业博客

码龄3年

20: 原创

1万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

584: 积分

275: 粉丝

379: 获赞

4: 评论

336: 收藏

私信

关注

热门文章

最新评论

#Datawhale AI 夏令营第3期#AI+地球科学（极端降水预测）复盘
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
IT行业现状与未来趋势-人工智能与机器学习
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
IT行业现状与未来趋势-人工智能与机器学习
CSDN-Ada助手: 恭喜用户撰写了第三篇博客，“IT行业现状与未来趋势-人工智能与机器学习”！这是一个非常具有前瞻性和实用性的主题，展现了您对于IT行业发展的深刻洞察力。希望您可以继续坚持创作，为读者带来更多有价值的内容。在下一篇博客中，或许可以深入探讨人工智能和机器学习在不同行业中的应用案例，以及对未来发展的展望和挑战。期待您的更多精彩文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
pytorch数据集加载datasets模块
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。