2023年最新的热点,就是多模态大模型。许多大厂都看到了其中巨大的潜力,纷纷入局。多模态大模型已经成为了下一个风口,提早准备才能在下一个红利到来时更有优势。
就在今年,由腾讯联合中科大厦大发布了多模态大模型首篇综述和排名榜单。随后,微软7位专家撰写119页综述。其中,两篇综述介绍了4个关键技术与5个研究方向,榜单排名了最新28个多模态大模型。
我在研究多模态大模型时,也整理了4个关键技术论文共70篇、5个研究方向论文共40篇、以及TOP28多模态大模型code。现在分享给大家一起学习,欢迎下载:
多模态大模型4个技术与5个方向
腾讯综述中总结:多模态大模型4个关键技术是多模态指令微调、多模态上下文学习、多模态思维链、LLM辅助视觉推理。
微软综述中,总结多模态大模型5个研究方向是视觉理解、视觉生成、统一视觉模型、LLM加持多模态大模型、多模态agent。
我整理了4个关键技术论文共70篇、5个研究方向论文共40篇。欢迎大家扫码下载:
TOP28多模态大模型榜单
腾讯今年发布的榜单,最初只有12个大模型。现在已经更新到16个榜单28个多模态大模型。
TOP28多模态大模型code我整理好了,大家可以扫码下载下来,进行学习与研究。
直播讲座
多模态大模型的研究离不开NLP大模型的基础。11月15日20:00,我邀请了TOP3高校博士Scott老师做客直播间,为大家带来《NLP大模型:基础、前沿与学习路径》直播讲座,机会难得千万不要错过哦!