百模大战迷人眼？这份AI模型&API最强选型指南请收好！

本文链接：https://blog.csdn.net/Python_cocola/article/details/140333955

TLDR

AI模型选择需要在质量、速度和价格之间进行权衡。
小型新兴API提供商在输出速度和价格方面表现出色，为用户提供了更具竞争力的选择。
API提供商通常对输入和输出token收取不同的价格，这可能会显著影响最终的成本。

一、AI 现状概述

人工智能正在以前所未有的速度改变着我们的世界，语言模型作为AI的核心技术之一，也正在经历着日新月异的发展。为了让开发者和企业更好地利用语言模型，众多科技巨头和初创公司纷纷推出了自己的语言模型和API服务。但面对眼花缭乱的选择，如何做出明智的决策成为了摆在开发者和企业面前的难题。

二、模型选择指南

Artificial Analysis平台对市面上主流的AI模型进行了深度分析，并根据模型质量、速度、价格等因素为开发者和企业提供选择建议。

2.1 根据能力比较质量

Artificial Analysis平台根据模型的能力类别对模型质量进行了分类评估，例如根据聊天机器人竞技场、推理和知识、编码能力进行分类。

不同的应用场景需要考虑不同的评估测试。
聊天机器人竞技场是评估沟通能力的良好测试，而MMLU则更全面地测试推理和知识。

(图1：不同模型质量对比图)

2.2 质量 vs. 输出速度

Artificial Analysis平台将模型质量与输出速度进行了对比分析，并根据价格将不同模型划分到不同的象限，方便用户根据自身需求快速定位。

模型质量和输出速度之间需要权衡，质量更高的模型通常输出速度较慢。
部分模型在保证高质量的同时，也能提供较快的输出速度和有竞争力的价格。

(图2：不同模型质量 vs. 输出速度对比图)

2.3 质量 vs. 价格

Artificial Analysis平台将模型质量与价格进行了对比分析，并根据价格将不同模型划分到不同的象限，方便用户根据自身需求快速定位。

虽然质量更高的模型通常价格更高，但并非所有模型都遵循相同的价格-质量曲线。
部分模型在保证高质量的同时，也能提供更具竞争力的价格。

(图3：不同模型质量 vs. 价格对比图)

2.4 输出速度

(图4：不同模型输出速度对比图)

2.5 输入和输出token价格

价格差异巨大，输入和输出token价格之间，以及最昂贵和最便宜的模型之间，价格可能相差几个数量级（>10倍）。

(图5：不同模型输入和输出价格对比图)

三、API 提供商选择指南

在选择API提供商时，需要考虑以下因素：

价格和技术性能指标： 比较不同提供商的价格、吞吐量和延迟等指标，选择最符合预算和性能需求的方案。
模型可用性： 不同的API提供商支持的模型不同，需要选择提供所需模型的提供商。
其他因素： 还需要考虑OpenAI兼容性、速率限制、上下文窗口大小等细节因素。

3.1 Llama 3 Instruct (70B) 模型案例分析

3.1.1 输出速度 vs. 价格

小型新兴提供商正在以具有竞争力的价格提供高输出速度。

(图6：Llama 3 Instruct (70B) 模型不同API提供商速度价格对比图)

3.1.2 输入和输出token价格

提供商通常对输入和输出token收取不同的价格。
某些用例的输入/输出token价格比率可能会严重影响总成本。

(图7：Llama 3 Instruct (70B) 模型不同API提供商输入输出token价格对比图)

3.1.3 输出速度随时间变化

小型新兴提供商提供高输出速度，但提供的精确速度每天都在变化。

(图8：Llama 3 Instruct (70B) 模型不同API提供商输出速度随时间变化图)

四、 AI模型与API提供商的选择流程

为了做出最佳选择，建议遵循以下流程：

明确用例需求： 首先明确你的应用场景和需求，例如是需要用于聊天机器人、文本生成、代码生成还是其他任务，以及对模型的质量、速度、价格等方面有什么具体的要求。
选择合适的模型： 根据你的用例需求，初步筛选出符合条件的模型，并进行定制化测试，以便更准确地评估模型的性能表现。Artificial Analysis平台提供了丰富的模型信息和测试工具，可以帮助你快速找到合适的模型。
选择合适的API提供商： 在确定了合适的模型之后，你需要选择一家提供该模型的API提供商。不同的API提供商在价格、性能、功能等方面都存在差异，你需要根据自身的需求进行权衡选择。

五、主流模型一览

(表1：主流模型信息汇总表)

模型名称	创建者	License	上下文窗口
GPT-4o	OpenAI	Proprietary	128k
GPT-4 Turbo	OpenAI	Proprietary	128k
GPT-4	OpenAI	Proprietary	8k
GPT-3.5 Turbo Instruct	OpenAI	Proprietary	4k
GPT-3.5 Turbo	OpenAI	Proprietary	16k
Gemini 1.5 Pro	Google	Proprietary	1m
Gemini 1.5 Flash	Google	Proprietary	1m
Gemma 2 (9B)	Google	Open	8k
Gemini 1.0 Pro	Google	Proprietary	33k
Gemma 7B Instruct	Google	Open	8k
Llama 3 Instruct (70B)	Meta	Open	8k
Llama 3 Instruct (8B)	Meta	Open	8k
Llama 2 Chat (70B)	Meta	Open	4k
Llama 2 Chat (13B)	Meta	Open	4k
Code Llama Instruct (70B)	Meta	Open	16k
Llama 2 Chat (7B)	Meta	Open	4k
Mistral Large	Mistral	Proprietary	33k
Mixtral 8x22B Instruct	Mistral	Open	65k
Mistral Small	Mistral	Proprietary	33k
Mistral Medium	Mistral	Proprietary	33k
Mixtral 8x7B Instruct	Mistral	Open	33k
Mistral 7B Instruct	Mistral	Open	33k
Claude 3.5 Sonnet	Anthropic	Proprietary	200k
Claude 3 Opus	Anthropic	Proprietary	200k
Claude 3 Sonnet	Anthropic	Proprietary	200k
Claude 3 Haiku	Anthropic	Proprietary	200k
Claude 2.0	Anthropic	Proprietary	100k
Claude Instant	Anthropic	Proprietary	100k
Claude 2.1	Anthropic	Proprietary	200k
Command Light	Cohere	Proprietary	4k
Command	Cohere	Proprietary	4k
Command-R+	Cohere	Open	128k
Command-R	Cohere	Open	128k
OpenChat 3.5 (1210)	OpenChat	Open	8k
DBRX Instruct	Databricks	Open	33k
Reka Core	Reka AI	Proprietary	128k
Reka Flash	Reka AI	Proprietary	128k
Reka Edge	Reka AI	Proprietary	64k
Jamba Instruct	AI21 Labs	Open	256k
DeepSeek-V2-Chat	DeepSeek	Open	128k
Arctic Instruct	Snowflake	Open	4k
Qwen2 Instruct (72B)	Alibaba	Open	128k

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述