大模型日报 2024-08-11
大模型资讯
-
Excel永不死!红杉资本分析师:ChatGPT就是新的Excel,催生3000亿美元市场 红杉资本分析师认为,ChatGPT将成为新的Excel,催生3000亿美元市场。Excel的持久性和灵活性使其在各种应用中仍然重要,用户可以在Excel中构建复杂模型而无需外部帮助。随着无代码和低代码产品的兴起,许多新软件受到Excel的启发,可能会对未来的创造和交流方式产生重大影响。
大模型产品
-
混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合 Meta FAIR的Chameleon团队提出了一种新的单一Transformer架构,可以根据下一个token的预测目标,对由离散图像和文本token组成的混合模态序列进行建模,从而在不同模态之间进行无缝推理和生成。他们还提出了MoMa:模态感知型专家混合架构,通过整合针对具体模态的模块来优化混合模态模型的能力。该模型在生成混合模态长回答任务中表现出色,甚至打败了商用模型Gemini 1.0 Pro和GPT-4V。
大模型论文
-
ACL 2024 Oral|我们离真正的多模态思维链推理还有多远? 该文章介绍了多模态思维链推理领域的研究进展和挑战。作者指出当前多模态思维链基准存在的问题,并提出了一个新的基准来解决这些问题。文章还介绍了数据构建过程和主流多模态大语言模型的评测结果。这篇文章对于了解多模态思维链推理的最新进展和未来发展方向具有重要意义。
大模型开源项目
-
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA 该文章介绍了苹果研究人员提出的一种新的视频大语言模型(LLM)架构,名为SlowFast-LLaVA(SF-LLaVA)。该模型通过两种不同的观察速度(Slow和Fast)来理解视频中的细节和运动,解决了现有视频LLM的痛点。实验结果显示,SF-LLaVA在多个视频问答任务中表现出显著的优势,超越了现有的免训练方法。该研究对于视频生成领域的发展具有重要意义。
本文由 mdnice 多平台发布