关键信息:
-
数学模型如NuminaMath和Mathstral。
-
NuminaMath获得AIMO一等进步奖,模型与数据都开源
-
-
小型模型在手机上的性能越来越好。
-
Agents和Function Calling在大型语言模型(LLM)中越来越流行。
-
多模态模型,特别是在图像+文本领域和音频领域,CogVLM2、InternVL 2.0
-
无需OCR或分割即可获得文档良好嵌入的视觉嵌入模型。
-
文本到图像的技术有新的玩家加入,如Anole、Fal和腾讯。
-
开源大模型越来越强,Meta的Llama 3.1 405B,以及Mistral Large 2(代码生成、数学和推理方面表现出色,与 GPT-4o、Claude 3 Opus 和 Llama 3 405B 等相当)
报告PPT详情:
来源 | PaperAgent