2024年度最佳大型语言模型(LLMs)汇总_2024大语言模型-CSDN博客

本文链接：https://blog.csdn.net/SE_JW/article/details/136833864

本文介绍了大型语言模型（LLMs）的发展历程，以ChatGPT为例，探讨了OpenAI、Google和Meta等公司开发的LLM，包括它们的参数、应用和潜力。文章还预测了未来LLMs的发展趋势，如多模态模型和企业部署的增加。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大型语言模型(LLMs)是人工智能文本处理的主要类型，也现在最流行的人工智能应用形态。ChatGPT是迄今为止最著名的使用LLM的工具，它由OpenAI的GPT模型的特别调整版本提供动力。但还有许多其他聊天机器人和文本生成器，包括从Google Bard和Anthropic的Claude到Writesonic和Jasper，它们都是建立在LLMs之上的。

自2010年代末以来，众多的LLM一直在研究实验室中酝酿，如果不是ChatGPT的出现，它们可能还会继续待在实验室里孤芳自赏，但在ChatGPT发布并展示出色实力后，它们也冲出实验室，进入了现实世界。有些 LLM 已经开发了多年，有些则迅速发展起来以赶上最新的炒作周期，还有更多的是开源研究工具。

2024年最佳LLMs

目前大概有几十个主要的LLMs，还有数百个由于某种原因而具有争议的，将它们全部列出几乎是不可能的，而且无论如何，由于LLMs的发展速度很快，它可能会在几天内过时。

对于“最佳”这个词，我们不妨持保留态度：我已经试图通过提供一个最重要、最有趣和最流行的 LLM(和 LMM)列表来缩小范围，而不一定是那些在基准测试中表现优异的(尽管其中大多数是这样)。我还主要关注您可以使用的 LLM，而不是那些超级有趣的研究论文的主题，因为我们喜欢在这里保持实用性。

在开始之前还有最后一件事：很多人工智能应用都没有列出它们所依赖的LLM。有些我们可以猜测，或者从他们的营销材料中可以清楚地看出，但对于大多数应用，我们只是不知道。这就是为什么你会在下面的表格中看到“未披露”——这只是意味着我们不知道任何使用LLM的主要应用，尽管可能有一些应用使用了它。

LLM	开发者	热门应用	参数数量	访问方式
GPT	OpenAI	Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT	175 billion+	API
Gemini	Google	Some queries on Bard	Nano: 1.8 & 3.25 billion; others unknown	API
PaLM 2	Google	Google Bard, Docs, Gmail, and other Google apps	340 billion	API
Llama 2	Meta	未披露	7, 13, and 70 billion	Open source
Vicuna	LMSYS Org	Chatbot Arena	7, 13, and 33 billion	Open source
Claude 2	Anthropic	Slack, Notion, Zoom	Unknown	API