【2024年终总结】2024年AI大模型总结报告 | Artificial Analysis

最新推荐文章于 2025-05-03 09:07:35 发布

快乐小码农

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量1.2k

点赞数 17

分类专栏：开源大模型多模态大模型 AI 文章标签：人工智能 AI论文开源大模型

本文链接：https://blog.csdn.net/u012744245/article/details/144956510

版权

AI 同时被 3 个专栏收录

59 篇文章

订阅专栏

开源大模型

57 篇文章

订阅专栏

多模态大模型

35 篇文章

订阅专栏

2024年是大模型发展非常迅速的一年，我们见证了太多AI技术变革带来的惊艳！

这一年里，各家大模型的能力提升层出不穷。LLM方面，OpenAI发布了更强的o系列模型；文生图开源模型也出现了 SD 的替代者 Flux；视频生成模型更是百花齐放，很多大模型公司都推出了类 Sora 的视频生成模型。

近日，Artificial Analysis 回顾了2024年人工智能的重大事件，梳理出了一份关于人工智能领域的年终总结。

Artificial Analysis：

Artificial Analysis 是一家领先的独立AI基准测试和分析平台，上面分析的模型不仅包括LLM，还有视觉生成模型如文生图、文生视频等等。Artificial Analysis 上面提供了各个模型的性能以及成本对比，可以帮助大家来选择最适合的AI大模型。

官网：https://artificialanalysis.ai/

PART01 LLM 竞争格局

在前沿模型方面，2024年，多个实验室迎头赶上了 OpenAI 的 GPT-4，并且出现了首批超越 GPT-4 智能水平的模型。

OpenAI 的 GPT-4 在 2022 年 11 月通过 ChatGPT 中的 GPT-3.5 启动了语言模型竞赛，竞争对手用了大约18个月时间追赶。
开放权重模型（如 Meta、Mistral 和阿里巴巴的产品）逐渐接近并超越了 GPT-4 的智能水平。
2024年底，出现了首批显著超越 GPT-4 智能水平的模型，如 OpenAI 的 o1 系列，这些模型在推理时计算扩展、数据质量以及新的强化学习技术方面取得了突破。

在大模型竞赛中，美国在前沿模型领域占据主导地位，中国紧随其后，处于明显的第二位，只有少数其他国家展示了训练前沿模型的能力。

美国的主导地位：主要是ChatGPT、Gemini、Claude、Nova、LLama系列。
中国时处于第二梯队：取得国际关注与认同的主要有 Qwen2.5 Instruct 72B 与 DeepSeek V2.5。
其余国家则只有法国、加拿大、以色列达到了一定水平，大部分国家在这场竞赛中都与领先国家望尘莫及。

PART02 开源与闭源模型的差距缩小

在 Meta、Mistral 和阿里的模型推动下，开源模型和闭源商业模型之间的性能差距显著缩小。

PART03 推理成本大幅下降

2024年，各个智能水平的大语言模型推理定价大幅下降；GPT-4o mini 以 100 倍便宜的价格接近 GPT-4 的智能水平。

2024年，语言模型的推理定价大幅下降，尤其是小型模型的性能提升使得它们能够以更低的成本提供接近大型模型的智能水平。
例如，GPT-4o mini 的价格比早期版本降低了约 75 倍，而智能水平接近GPT-4。得分超越 GPT-4 Turbo 的国产大模型 Qwen2.5 72B 的价格也甚至只有 GPT-4 Turbo的1.3%。