知名模型/产品统计_internvl-14b-224px-CSDN博客

本文链接：https://blog.csdn.net/lovechris00/article/details/142468505

文章目录

以下，排名不分先后；方便查用。

智谱

Hugging Face | Github | zhipuai | 官网 | 大模型开放平台 | 官方文档 | Blog
模型介绍： https://bigmodel.cn/dev/howuse/model

语言模型

模型	描述	上下文	最大输出
GLM-4-Plus `New`	高智能旗舰: 性能全面提升，长文本和复杂任务能力显著增强	128K	4K
GLM-4-0520	高智能模型：适用于处理高度复杂和多样化的任务	128K	4K
GLM-4-Long	超长输入：专为处理超长文本和记忆型任务设计	1M	4K
GLM-4-AirX	极速推理：具有超快的推理速度和强大的推理效果	8K	4K
GLM-4-Air	高性价比：推理能力和价格之间最平衡的模型	128K	4K
GLM-4-Flash	免费调用：智谱AI首个免费API，零成本调用大模型。	128K	4K
GLM-4V	图像理解：具备图像理解能力和推理能力	2K	1k
GLM-4-AllTools	Agent模型：自主规划和执行复杂任务	128K	4K
GLM-4	旧版旗舰：发布于2024年1月16日，目前已被GLM-4-0520取代	128K	4K

多模态模型

模型	描述	最大输入	输出分辨率
GLM-4V-Plus `New`	视频和图像理解：具备视频内容和多图片的理解能力	8K	-
GLM-4V	图像理解：具备图像理解能力和推理能力	2K	-
CogVideoX	视频生成：输入文本或图片即可轻松制作视频	0.5K	1440x960
CogView-3.5 `New`	图片生成：根据用户文字描述生成高质量图像，支持多图片尺寸	1k	1024x1024 768x1344 864x1152 等
CogView-3	图片生成：根据用户文字描述快速、精准生成图像	1k	1024x1024

向量模型

模型	描述	最大输入	向量维度
Embedding-3	最新模型：支持自定义向量维度	8K	2048
Embedding-2	旧版模型：目前已被Embedding-3取代	8K	1024

其他模型

模型	描述	上下文	最大输出
ChatGLM-3	拟人模型：适用于情感陪伴和虚拟角色。	4K	2K
Emohaa	心理模型：具备专业咨询能力，帮助用户理解情感并应对情绪问题。	8K	4k
CodeGeeX-4	代码模型：适用于代码自动补全任务	128K	4k

即将弃用模型

我们已经宣布了以下模型的弃用日期。在这些模型弃用后，我们会将它们自动路由至新的模型。请用户注意在弃用日期之前，将您的模型编码更新为最新版本，以确保服务的顺畅过渡。

模型	弃用时间	指向模型
GLM-3-Turbo	2025年6月30日	GLM-4-Air
ChatGLM_Turbo	2024年9月30日	GLM-4-Air
ChatGLM_Pro	2024年9月30日	GLM-4-Air
ChatGLM_Std	2024年9月30日	GLM-4-Air
ChatGLM_Lite	2024年7月30日	GLM-4-Air

Qwen

通义千问分为闭源和开源两大版本。

开源模型包括：

通义千问 (Qwen)：语言模型
- Qwen: 1.8B、 7B、 14B 及 72B 模型
- Qwen1.5: 0.5B、 1.8B、 4B、 14BA2.7B、 7B、 14B、 32B、 72B 及 110B 模型
- Qwen2: 0.5B、 1.5B、 7B、 57A14B 及 72B 模型
- Qwen2.5: 0.5B、 1.5B、 3B、 7B、 14B、 32B 及 72B 模型
通义千问 VL (Qwen-VL): 视觉语言模型
- Qwen-VL: 基于 7B 的模型
- Qwen-VL: 基于 2B 、 7B 和 72B 的模型
通义千问 Audio: 音频语言模型
- Qwen-Audio: 基于 7B 的模型
- Qwen2-Audio: 基于 7B 的模型
Code通义千问 / 通义千问Coder：代码语言模型
- CodeQwen1.5: 7B 模型
- Qwen2.5-Coder: 7B 模型
通义千问 Math：数学语言模型
- Qwen2-Math： 1.5B、 7B 及 72B 模型
- Qwen2.5-Math： 1.5B、 7B 及 72B 模型

MoonShot

使用 API 模型列表： https://platform.moonshot.cn/docs/api/chat#list-models

当前支持的模型有：

moonshot-v1-8k: 它是一个长度为 8k 的模型，适用于生成短文本。
moonshot-v1-32k: 它是一个长度为 32k 的模型，适用于生成长文本。
moonshot-v1-128k: 它是一个长度为 128k 的模型，适用于生成超长文本。

InternLM

Hugging Face | Github | 官网| 官方文档
API 获取模型列表：https://internlm.intern-ai.org.cn/api/document (大部分人可能申请不到 API)

InternVL：GPT-4V的开创性开源替代品。
- InternVL 2.0 : InternVL2-Llama3-76B、InternVL2-Llama3-76B-AWQ、InternVL2-40B、InternVL2-40B-AWQ、InternVL2-26B、InternVL2-26B-AWQ 、InternVL2-8B、InternVL2-8B-AWQ 、InternVL2-4B、InternVL2-2B、InternVL2-2B-AWQ、InternVL2-1B、InternOmni
- InternVL 1.5 : InternVL-Chat-V1-5、InternVL-Chat-V1-5-AWQ、InternViT-300M-448px、InternViT-6B-448px-V1-5、Mini-InternVL-Chat-2B-V1-5、Mini-InternVL-Chat-4B-V1-5
- InternVL 1.0 : InternVL、InternVL-14B-224px、InternVL-14B-Flickr30K-FT-364px、InternVL-14B-FlickrCN-FT-364px、InternVL-Chat-V1-1、InternVL-Chat-V1-2、InternVL-Chat-V1-2-Plus、InternVL-Chat-ViT-6B-Vicuna-13B、InternVL-Chat-ViT-6B-Vicuna-13B-448px、InternVL-Chat-ViT-6B-Vicuna-7B、InternViT-6B-224px、InternViT-6B-448px-V1-0、InternViT-6B-448px-V1-2
InternImage：具有可变形卷积的大型视觉基础模型。
- DCNv4、InternImage、internimage_b_1k_224、internimage_s_1k_224、internimage_t_1k_224、internimage_xl_1k_384
InternVideo：用于多模态理解的大规模视频基础模型。
- InternVideo2 : InternVideo2-CLIP-1B-224p-f8、InternVideo2-Chat-8B、InternVideo2-Stage1-1B-224p-K400、InternVideo2-Stage1-1B-224p-K600、InternVideo2-Stage1-1B-224p-K700、InternVideo2-Stage1-1B-224p-f8、InternVideo2-Stage1-1B-224p-f8-MiT、InternVideo2-Stage1-1B-224p-f8-SthSth、InternVideo2-Stage1-1B-224p-f8-k710、InternVideo2-Stage2_1B-224p-f4、InternVideo2_Chat_8B_InternLM2_5、InternVideo2_Vid_Text、InternVideo2_chat_8B_好的、InternVideo2_distillation_models
- InternVid : InternVid、InternVid-10M-FLT-INFO、InternVid-Full、ViCLIP、ViCLIP-B-16-hf、ViCLIP-L-14-hf
- VideoMamba
VideoChat：用于视频理解的端到端聊天助手。
- VideoChat2-IT、VideoChat2_HD_stage4_Mistral_7B、VideoChat2_HD_stage4_Mistral_7B_hf、VideoChat2_stage2_Mistral_7B、VideoChat2_stage3_Mistral_7B
All-Seeing Project：走向全景视觉识别和开放世界的理解。
- AS-100M、AS-Core、AS-V2、ASM-FT、ASM-Pretrain、ASMv2、ASMv2-Stage1-Ft、ASMv2-Stage2-Pretrain、CRPE、Caption-Evaluation-Data、Region-Evaluation-Data

Meta Llama

官方model card : https://www.llama.com/docs/overview
Hugging Face | github | 官网| 官方文档 | Twitter

Llama 3.1 : Meta-Llama-3.1-8B、Meta-Llama-3.1-8B-Instruct、Meta-Llama-3.1-70B、Meta-Llama-3.1-70B-Instruct、Meta-Llama-3.1-405B、Meta-Llama-3.1-405B-Instruct、Meta-Llama-3.1-405B-FP8、Meta-Llama-3.1-405B-Instruct-FP8、Llama-Guard-3-8B、Llama-Guard-3-8B-INT8、Prompt-Guard-86M
Llama 3.1 Evals : Meta-Llama-3.1-8B-evals、Meta-Llama-3.1-8B-Instruct-evals、Meta-Llama-3.1-70B-evals、Meta-Llama-3.1-70B-Instruct-evals、Meta-Llama-3.1-405B-evals、Meta-Llama-3.1-405B-Instruct-evals
Meta Llama 3 : Meta-Llama-3-8B、Meta-Llama-3-8B-Instruct、Meta-Llama-3-70B-Instruct、Meta-Llama-3-70B、Meta-Llama-Guard-2-8B
Llama 2 Family : Llama-2-7b-hf、Llama-2-13b-hf、Llama-2-70b-hf、Llama-2-7b-chat-hf、Llama-2-13b-chat-hf、Llama-2-70b-chat-hf、Llama-2-7b、Llama-2-13b、Llama-2-70b、Llama-2-7b-chat、Llama-2-13b-chat、Llama-2-70b-chat、LlamaGuard-7b
Code Llama Family : CodeLlama-7b-hf、CodeLlama-13b-hf、CodeLlama-34b-hf、CodeLlama-70b-hf、CodeLlama-7b-Python-hf、CodeLlama-34b-Python-hf、CodeLlama-13b-Python-hf、CodeLlama-70b-Python-hf、CodeLlama-7b-Instruct-hf、CodeLlama-13b-Instruct-hf、CodeLlama-34b-Instruct-hf、CodeLlama-70b-Instruct-hf.

DeepSeek

Hugging Face | github | 官网| 官方文档 | Blog
DeepSeek LLM DeepSeek Coder DeepSeek Math DeepSeek VL DeepSeek V2 DeepSeek Coder V2
官方模型和定价说明：https://platform.deepseek.com/api-docs/quick_start/pricing

DeepSeek V2 Chat和DeepSeek Coder V2模型已经合并升级为新模型DeepSeek V2.5

DeepSeek-Prover : DeepSeek-Prover-V1、DeepSeek-Prover-V1.5-Base、DeepSeek-Prover-V1.5-RL、DeepSeek-Prover-V1.5-SFT
DeepSeek-V2 : DeepSeek-V2、DeepSeek-V2-Chat、DeepSeek-V2-Chat-0628、DeepSeek-V2-Lite、DeepSeek-V2-Lite-Chat、DeepSeek-V2.5
DeepSeekCoder-V2 : DeepSeek-Coder-V2-Base、DeepSeek-Coder-V2-Instruct、DeepSeek-Coder-V2-Instruct-0724、DeepSeek-Coder-V2-Lite-Base、DeepSeek-Coder-V2-Lite-Instruct
DeepSeek-Math :deepseek-math-7b-base、deepseek-math-7b-instruct、deepseek-math-7b-rl
ESFT : models for paper expert-specialized fine-tuning
- ESFT-gate-code-lite、ESFT-gate-intent-lite、ESFT-gate-law-lite、ESFT-gate-math-lite、ESFT-gate-summary-lite、ESFT-gate-translation-lite、ESFT-token-code-lite、ESFT-token-intent-lite、ESFT-token-law-lite、ESFT-token-math-lite、ESFT-token-summary-lite、ESFT-token-translation-lite、ESFT-vanilla-lite
DeepSeek-VL : deepseek-vl-7b-chat、deepseek-vl-1.3b-base、deepseek-vl-7b-base、deepseek-vl-1.3b-chat
DeepSeek-Coder : deepseek-coder-33b-instruct、deepseek-coder-6.7b-instruct、deepseek-coder-7b-instruct-v1.5、deepseek-coder-1.3b-instruct、deepseek-coder-6.7b-base、deepseek-coder-7b-base-v1.5、deepseek-coder-1.3b-base、deepseek-coder-33b-base
DeepSeek-LLM : deepseek-llm-67b-chat、deepseek-llm-7b-chat、deepseek-llm-67b-base、deepseek-llm-7b-base
DeepSeek-MoE : deepseek-moe-16b-base、deepseek-moe-16b-chat
DeepSeek-V2.5

Mistral AI

Hugging Face | Github | 官网 | 官方文档 | Blog
模型说明：https://docs.mistral.ai/getting-started/models/
Mistral 提供两种模型：免费模型和高级模型。

高级模型

模型	权重可用性	可通过API获得	描述	最大令牌	API端点	版本
Mistral Large	✔️ Mistral Research License	✔️	我们用于高复杂性任务的顶层推理模型，最新版本v2于2024年7月发布。了解更多信息，请访问我们的博客文章	128k	`mistral-large-latest`	24.07
Mistral Small	✔️ Mistral Research License	✔️	我们最新的企业级小型模型，最新版本v2于2024年9月发布。了解更多信息，请访问我们的博客文章	32k	`mistral-small-latest`	24.09
Codestral	✔️ Mistral Research License	✔️	我们用于编码的尖端语言模型于2024年5月发布	32k	`codestral-latest`	24.05
Mistral Embed		✔️	我们用于提取文本提取表示的最先进语义	8k	`mistral-embed`

免费模型

最新模型

模型	权重可用性	可通过应用编程接口	描述	最大令牌	应用编程接口端点	版本
Pixtral	✔️ Apache2	✔️	一个12B模型，除了文本之外还有图像理解功能。了解更多关于我们的博客文章	128k	`pixtral-12b-2409`	24.09

研究模型

模型	权重可用性	可通过API获得	描述	最大令牌	API端点	版本
Mistral Nemo	✔️ Apache2	✔️	我们最好的多语言开源模型于2024年7月发布。了解更多关于我们的博客文章	128k	`open-mistral-nemo`	24.07
Codestral Mamba	✔️ Apache2	✔️	我们的第一个Mamba 2开源模型于2024年7月发布。了解更多关于我们的博客文章	256k	`open-codestral-mamba`	v0.1
Mathstral	✔️ Apache2		我们的第一个数学开源模型于2024年7月发布。了解更多关于我们的博客文章	32k	NA	v0.1

传统模型

模型	权重可用性	可通过API获得	描述	最大令牌	API端点	版本
Mistral7B	✔️ Apache2	✔️	我们的第一个密集模型于2023年9月发布。了解更多关于我们的博客文章	32k	`open-mistral-7b`	v0.3
Mixtral 8x7B	✔️ Apache2	✔️	我们的第一个稀疏混合专家于2023年12月发布。了解更多关于我们的博客文章	32k	`open-mixtral-8x7b`	v0.1
Mixtral 8x	✔️ Apache2	✔️	我们迄今为止最好的开源模型于2024年4月发布。了解更多关于我们的博客文章	64k	`open-mixtral-8x22b`	v0.1

Google Gemma

Gemma 2 Release :
gemma-2-2b 、gemma-2-2b-it 、gemma-2-9b 、gemma-2-9b-it
PaliGemma Release :
paligemma-3b-pt-224 、paligemma-3b-pt-448 、paligemma-3b-pt-896
PaliGemma FT Models
paligemma-3b-ft-ai2d-224-jax 、paligemma-3b-ft-ai2d-448-jax 、paligemma-3b-ft-aokvqa-da-224-jax 、paligemma-3b-ft-aokvqa-da-448-jax
CodeGemma Release
codegemma-2b 、codegemma-7b 、codegemma-7b-it 、codegemma-7b-it-GGUF
RecurrentGemma Release
recurrentgemma-9b 、recurrentgemma-9b-it 、recurrentgemma-2b-it 、recurrentgemma-2b
Gemma Release
gemma-1.1-2b-it 、gemma-1.1-7b-it 、gemma-1.1-7b-it-GGUF 、gemma-1.1-2b-it-GGUF
Gemma 2 2B Release
gemma-2-2b 、gemma-2-2b-it 、gemma-2-2b-pytorch 、gemma-2-2b-it-pytorch
ShieldGemma Release
shieldgemma-2b 、shieldgemma-9b 、shieldgemma-27b
Gemma Scope Release
gemma-scope 、gemma-scope-2b-pt-res 、gemma-scope-2b-pt-mlp 、gemma-scope-2b-pt-att
BERT Release
bert-base-cased 、bert-base-uncased 、bert-large-cased 、bert-large-uncased
ALBERT Release
albert-base-v1 、albert-large-v1 、albert-xlarge-v1 、albert-xxlarge-v1
ELECTRA Release
electra-small-generator 、electra-small-discriminator 、electra-base-generator 、electra-base-discriminator
Flan-T5 Release
flan-t5-small 、flan-t5-base 、flan-t5-large 、flan-t5-xxl
T5 Release
t5-base 、t5-small 、t5-large 、mt5-base 、mt5-large 、umt5-small 、umt5-xl
seahorse Release
seahorse-xxl-q1 、seahorse-xxl-q2 、seahorse-xxl-q3 、seahorse-xxl-q4
Switch-Transformers Release
switch-base-256 、switch-base-128 、switch-base-64 、switch-base-32
SigLIP
siglip-so400m-patch14-384 、siglip-base-patch16-256-multilingual 、siglip-base-patch16-512 、siglip-base-patch16-384
Metricx-23
metricx-23-qe-large-v2p0 、metricx-23-qe-xl-v2p0 、metricx-23-qe-xxl-v2p0 、metricx-23-large-v2p0
IndicGenBench 、IndicGenBench_xquad_in 、IndicGenBench_crosssum_in 、IndicGenBench_xorqa_in 、IndicGenBench_flores_in
ImageInWords
DataGemma
datagemma-rag-27b-it 、datagemma-rig-27b-it
TimesFM Release 、timesfm-1.0-200m 、timesfm-1.0-200m-pytorch

Jina AI

Hugging Face | Github | 官网 | Blog | Twitter

jina-embeddings-v3 : jina-embeddings-v3
Jina Reranker v2 : jina-reranker-v2-base-multilingual
jina-clip : jina-clip-v1
late interaction retrievers : jina-colbert-v2、jina-colbert-v2-64、jina-colbert-v1-en
jina-embeddings-v2 : jina-embeddings-v2-base-en、jina-embeddings-v2-base-zh、jina-embeddings-v2-small-en、jina-embeddings-v2-base-de、jina-embeddings-v2-base-es、jina-embeddings-v2-base-code
jina-embeddings-v1 : jina-embedding-l-en-v1、jina-embedding-b-en-v1、jina-embedding-s-en-v1、jina-embedding-t-en-v1
Jina Reranker v1 : jina-reranker-v1-turbo-en、jina-reranker-v1-tiny-en

2024-09-23（一）