大型语言模型(LLMs)是人工智能文本处理的主要类型,也现在最流行的人工智能应用形态。ChatGPT是迄今为止最著名的使用LLM的工具,它由OpenAI的GPT模型的特别调整版本提供动力。但还有许多其他聊天机器人和文本生成器,包括从Google Bard和Anthropic的Claude到Writesonic和Jasper,它们都是建立在LLMs之上的。
自2010年代末以来,众多的LLM一直在研究实验室中酝酿,如果不是ChatGPT的出现,它们可能还会继续待在实验室里孤芳自赏,但在ChatGPT发布并展示出色实力后,它们也冲出实验室,进入了现实世界。 有些 LLM 已经开发了多年,有些则迅速发展起来以赶上最新的炒作周期,还有更多的是开源研究工具。
2024年最佳LLMs
目前大概有几十个主要的LLMs,还有数百个由于某种原因而具有争议的,将它们全部列出几乎是不可能的,而且无论如何,由于LLMs的发展速度很快,它可能会在几天内过时。
对于“最佳”这个词,我们不妨持保留态度:我已经试图通过提供一个最重要、最有趣和最流行的 LLM(和 LMM)列表来缩小范围,而不一定是那些在基准测试中表现优异的(尽管其中大多数是这样)。 我还主要关注您可以使用的 LLM,而不是那些超级有趣的研究论文的主题,因为我们喜欢在这里保持实用性。
在开始之前还有最后一件事:很多人工智能应用都没有列出它们所依赖的LLM。有些我们可以猜测,或者从他们的营销材料中可以清楚地看出,但对于大多数应用,我们只是不知道。这就是为什么你会在下面的表格中看到“未披露”——这只是意味着我们不知道任何使用LLM的主要应用,尽管可能有一些应用使用了它。
LLM |
开发者 |
热门应用 |
参数数量 |
访问方式 |
GPT |
OpenAI |
Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT |
175 billion+ |
API |
Gemini |
|
Some queries on Bard |
Nano: 1.8 & 3.25 billion; others unknown |
API |
PaLM 2 |
|
Google Bard, Docs, Gmail, and other Google apps |
340 billion |
API |
Llama 2 |
Meta |
未披露 |
7, 13, and 70 billion |
Open source |
Vicuna |
LMSYS Org |
Chatbot Arena |
7, 13, and 33 billion |
Open source |
Claude 2 |
Anthropic |
Slack, Notion, Zoom |
Unknown |
API |
Stable Beluga |
Stability AI |
未披露 |
7, 13, and 70 billion |
Open source |