![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
多模态大语言模型
文章平均质量分 92
isongxw
这个作者很懒,什么都没留下…
展开
-
VisionLLM v2详解
VisionLLM v2提出了一种新的信息传输机制,称为“super link”,能够作为媒介将 MLLM 与特定下游任务decoder连接起来,使VisionLLM v2获得了端到端的多个不同下游任务的处理能力。Super Link不仅能够对MLLM和多个下游任务解码器之间的任务信息和梯度反馈进行灵活的传输,而且有效地解决了同一个模型的多任务场景下的训练冲突。原创 2024-07-08 23:29:27 · 824 阅读 · 0 评论 -
多模态大模型训练数据与资源总结
总结对比QWenVL、Vary、InternVL-V-1.5三个多模态大模型的预训练阶段与Finetune阶段对于数据量与训练资源的需求。目标是借此了解多模态大模型在训练过程中需要的数据类型数据量级以及训练资源。原创 2024-06-28 17:36:11 · 543 阅读 · 0 评论