宣传下InternVL2,最好的开源多模态基础模型

作者 | 代季峰  编辑 | 自动驾驶之心

原文链接:https://zhuanlan.zhihu.com/p/710003499

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心大语言模型技术交流群

本文只做学术分享,如有侵权,联系删文

最近忙完了WAIC,有空写个帖子,宣传下InternVL2,最好的开源多模态基础模型,以及介绍下背后的几篇论文:

2b4034b97f245293ee535fdb3e0f6074.png 1a999ff873dedbc16a4a01ccf79b4697.png 5ecdfa2a2cec5185a89b8075171a0a03.png c7abe19f0756e4c9e11b304fa788bc04.png b41c7fc458f11809495d5a0ea2f3277a.png

第一篇:

OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text

世界上最大的图文交错数据集,支持我们模型的训练

dadaf4f325deca32aedddf109f9f00e8.png d1717edece337b6145af2217ce33a142.png

第二篇:

Vision Model Pre-training on Interleaved Image-Text Data via Latent Compression Learning

首创多模态信息压缩学习,首次支持互联网尺度图文交错数据端到端预训练算法

第三篇:

VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks

https://arxiv.org/abs/2406.08394

VisionLLM v2通用任务解码器(强化模型专项能力):首创向量链接技术,连接多模态大模型和各领域专用模型,通专结合,拓展多模态大模型的基础能力

bd26272e3ee894c535ce905dc91770c5.png 811acd155b2c7334a4d206ca6380eed4.png 8463384ec0fcc04d4a0f14c5f870f035.png

投稿作者为『自动驾驶之心知识星球』特邀嘉宾,欢迎加入交流!重磅,自动驾驶之心科研论文辅导来啦,申博、CCF系列、SCI、EI、毕业论文、比赛辅导等多个方向,欢迎联系我们!

a4079f5437e4d4f9cf3e2abb6f47096a.jpeg

① 全网独家视频课程

BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、cuda与TensorRT模型部署大模型与自动驾驶Nerf语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

1c1d9d6ac1e7fb1823e067bbaa3c5cd5.png

网页端官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业,近3000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型、端到端等,更有行业动态和岗位发布!欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频

abc2a4ec18cfdf03e1aaa61fafe22b70.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦感知、定位、融合、规控、标定、端到端、仿真、产品经理、自动驾驶开发、自动标注与数据闭环多个方向,目前近60+技术交流群,欢迎加入!扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

dcef8042ca04d385f4a0cb79322a8892.jpeg

④【自动驾驶之心】全平台矩阵

e6a7dc58d3571cfd4e79081ce4b8e737.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值