2025年Q1大模型更新汇总

高通智匠MindCraft Al

于 2025-04-02 11:00:25 发布

阅读量1.2k

点赞数 7

文章标签：人工智能 gpt ai AIGC 语言模型

本文链接：https://blog.csdn.net/2401_85549225/article/details/146936603

版权

本篇内容将盘点2025年Q1所有的主流大模型更新汇总

通义千问（国内大模型劳模）
- 推理模型：QWQ-32B，QWQ-Plus

概括：32B推理模型性能比肩deepseek-r1。QWQ-32B为开源版，QWQ-Plus为商业版，性能和价格更佳。

价格：QWQ-Plus：输入1.6元/百万tokens，输出4元/百万tokens

视觉模型：qwen2.5-vl-72b-instruct, qwen2.5-vl-32b-instruct

概括：通义千问旗舰款视觉推理模型。达到行业顶尖水平，在视觉agent，多国语言OCR有突出优势，并且支持图像坐标标识。

价格：

qwen2.5-vl-72b-instruct：输入16元/百万tokens，输出48元/百万tokens

qwen2.5-vl-32b-instruct：输入8元/百万tokens，输出24元/百万tokens

文本模型：Qwen-Max

概括：通义千问旗舰款大模型，性能超越初版deepseek v3，最大上下文32K

价格：输入2.4元/百万tokens，输出9.6元/百万tokens

长文本模型：qwen2.5-14b-instruct-1m，Qwen-Turbo

概括：通义千问长文本模型，支持1M上下文。性能不是行业顶尖，价格便宜，性价比高

价格：

qwen-turbo：输入0.3元/百万tokens，输出0.6元/百万tokens

qwen2.5-14b-instruct-1m：输入1元/百万tokens，输出3元/百万tokens

多模态模型：qwen-omni-turbo

概括：通义千问多模态模型，支持音频，文字，图片和视频的输入，输出为文字和音频。最大上下文32K。

价格：不同的数据输入输出价格不同，参考官方文档

图片生成：wanx2.1-t2i-plus，wanx2.1-t2i-turbo

概括：通义千问最新版文生图模型，plus为旗舰款，turbo为轻量版。

价格：

wanx2.1-t2i-plus：0.14元/次

wanx2.1-t2i-turbo：0.2元/次

视频生成：wanx2.1-i2v-plus，wanx2.1-i2v-turbo，wanx2.1-t2v-plus，wanx2.1-t2v-turbo

概括：通义千问最新版视频生成模型，有文生视频和图生视频版本，plus为旗舰款，turbo为轻量版。

价格：

wanx2.1-i2v-plus，wanx2.1-t2v-plus：0.7元/秒=3.5元/5秒

wanx2.1-i2v-turbo，wanx2.1-t2v-turbo：0.24元/秒=1.2元/5秒

智谱（赛博菩萨）

文本模型：GLM-4-Air-0111

概括：智谱超值款文本模型，性能提升，价格降低一倍

价格：输入和输出0.5元/百万tokens

视觉模型：GLM-4V-Plus-0111，GLM-4V-Flash

概括：智谱视觉模型，GLM-4V-Plus-0111为旗舰款，价廉物美。GLM-4V-Flash为免费款，可以满足基础性任务。

价格：

GLM-4V-Plus-0111：输入和输出4元/百万tokens

GLM-4V-Flash：免费

推理模型：GLM-Zero-Preview

概括：智谱版推理模型，目前还是预览版

价格：输入和输出10元/百万tokens

图片生成：CogView-4-250304，CogView-Flash

概括：CogView-4-250304是国内高性价比的文生图模型，新版本对文字显示支持较好。CogView-Flash是免费文生图模型，性能尚可。

价格：

CogView-4：0.06元/次

CogView-Flash：免费

视频生成：CogVideoX-2，CogVideoX-Flash

概括：CogVideoX-2是国内性价比极高的文生视频模型。CogVideoX-Flash是免费视频生成模型。

价格：

CogVideoX-2：0.5元/次

CogVideoX-Flash：免费

豆包
文本模型：Doubao-1.5-pro-32k，Doubao-1.5-pro-256k，Doubao-1.5-lite-32k

概括：豆包更新1.5版本模型，性能达到行业顶级水平，价格便宜。

价格：

Doubao-1.5-pro-32k：输入0.8元/百万tokens，输出2元/百万tokens

Doubao-1.5-pro-256k：输入5元/百万tokens，输出5元/百万tokens

Doubao-1.5-lite-32k：输入0.3元/百万tokens，输出0.6元/百万tokens

视觉模型：Doubao-1.5-vision-pro-32k

概括：行业顶级的视觉模型，同时价格极低。

价格：输入3元/百万tokens，输出9元/百万tokens

图片生成：通用2.1模型（文生图）

概括：提升结构准确度和美感，重点支持中英文字符渲染

价格：0.2元/次

视频生成：Seaweed

概括：豆包的视频生成模型，支持文生视频和图生视频，用chat接口调用，支持高度自定义的视频输出。

价格：视频生成有复杂的计算公式

Deepseek
deepseek-r1

概括：这个模型大家都很熟，2025年1月20日发布的deepseek r1，性能达到了当时最好的模型o1的水准，但是价格便宜了30倍并且开源。引起国际社会轰动。

价格：输入4元/百万tokens，输出16元/百万tokens

deepseek-v3-0324

概括：大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

价格：输入2元/百万tokens，输出8元/百万tokens

MiniMax
文本：Minimax-Text-01

概括：综合性能强，长文本能力目前第一，1M上下文

价格：输入1元/百万tokens，输出8元/百万tokens

图片生成：image-01

概括：性价比极高的文生图模型

价格：0.025元/每次

腾讯混元
文本：hunyuan-turbos

概括：官方推荐的高性价比文本模型，上下文32K

价格：输入0.8元/百万tokens，输出2元/百万tokens

推理：hunyuan-t1

概括：腾讯混元版的推理模型

价格：输入1元/百万tokens，输出4元/百万tokens

文心一言
- 多模态：ernie-4.5-8k-preview

概括：百度的新一代旗舰多模态模型，目前支持文本+图片输入，文本输出。预览版上下文为8K。

价格：输入4元/百万tokens，输出16元/百万tokens

Kimi
- 多模态：kimi-latest

概括：kimi最新版模型的API，支持图片+文字输入。上下文可达128K。

价格：输入和输出60元/百万tokens

OpenAI
- 推理：o3-mini

概括：OpenAI针对deepseek-r1推出的推理模型，部分性能比o1更强但价格接近deepseek-r1

价格：输入10元/百万tokens，输出40元/百万tokens

多模态：GPT4.5

概括：OpenAI最新推出的旗舰款模型。性能更强，但是价格巨贵，劝退路人。

价格：输入600元/百万tokens，输出1200元/百万tokens

Anthropic
多模态：claude-3.7-sonnet

概括：最新版本的claude，各方面性能都有所提升，设计前端页面审美很在线，目前claude似乎在专注于编程和agent这个领域。

推理：claude-3.7-sonnet-thinking

概括：claude3.7的推理版

价格：输入22元/百万tokens，输出110元/百万tokens

Gemini
多模态：gemini-2.0-flash, gemini-2.0-pro

概括：谷歌在第一季度发布了gemini2.0系列的模型，pro代表着旗舰款，而flash代表快速和轻量，实际上flash的性能也不错，尤其是在识图方面。pro版目前还是在实验阶段，尚未收费。gemini-2.0-flash的性价比则是相当优秀。谷歌的模型都支持多模态的输入，上下文为1M。

价格：

gemini-2.0-flash-001：输入0.8元/百万tokens，输出3.2元/百万tokens

gemini-2.0-flash-lite：输入0.6元/百万tokens，输出2.4元/百万tokens

gemini-2.0-pro：免费

推理：gemini-2.0-flash-thinking，gemini-2.5-pro

概括：gemini也是早早推出了推理模型gemini-2.0-flash-thinking，而在3月底迭代了gemini-2.5-pro推理模型，号称当时最强，超越GPT4.5和o3-mini。此模型支持多模态输入，上下文达到1M。目前处于实验阶段，尚不收费。

价格：免费

图片生成：gemini-2.0-flash-exp-image-generation

概括：gemini推出的图片生成和编辑模型，说两句话就可以让图片变样，在多模态模型领域中比较新颖，因为增加了多模态的输出能力。由于是实验阶段，此模型暂不收费。

价格：免费

Grok
文本：grok3

概括：马斯克的XAI推出的旗舰款模型。性能短暂霸榜。还是一款不错的模型，只能说现在实在太卷了。

以上模型都可以在高通智匠的客户端，小程序，网页版上使用。也可以在开发者平台上调用API。

2025年Q1大模型更新汇总

本篇内容将盘点2025年Q1所有的主流大模型更新汇总

通义千问（国内大模型劳模）

推理模型：QWQ-32B，QWQ-Plus

视觉模型：qwen2.5-vl-72b-instruct, qwen2.5-vl-32b-instruct

文本模型：Qwen-Max

​​​​​​​多模态模型：qwen-omni-turbo

图片生成：wanx2.1-t2i-plus，wanx2.1-t2i-turbo

视频生成：wanx2.1-i2v-plus，wanx2.1-i2v-turbo，wanx2.1-t2v-plus，wanx2.1-t2v-turbo

智谱（赛博菩萨）

文本模型：GLM-4-Air-0111

​​​​​​​视觉模型：GLM-4V-Plus-0111，GLM-4V-Flash

​​​​​​​推理模型：GLM-Zero-Preview

​​​​​​​图片生成：CogView-4-250304，CogView-Flash

​​​​​​​​​​​​​​视频生成：CogVideoX-2，CogVideoX-Flash

豆包

文本模型：Doubao-1.5-pro-32k，Doubao-1.5-pro-256k，Doubao-1.5-lite-32k

​​​​​​​视觉模型：Doubao-1.5-vision-pro-32k

​​​​​​​图片生成：通用2.1模型（文生图）

​​​​​​​视频生成：Seaweed

deepseek-v3-0324

MiniMax

文本：Minimax-Text-01

​​​​​​​图片生成：image-01

腾讯混元

文本：hunyuan-turbos

​​​​​​​推理：hunyuan-t1

文心一言

多模态：ernie-4.5-8k-preview

Kimi

多模态：kimi-latest

OpenAI

推理：o3-mini

​​​​​​​多模态：GPT4.5

Anthropic

多模态：claude-3.7-sonnet

​​​​​​​推理：claude-3.7-sonnet-thinking

Gemini

多模态：gemini-2.0-flash, gemini-2.0-pro

​​​​​​​推理：gemini-2.0-flash-thinking，gemini-2.5-pro

​​​​​​​图片生成：gemini-2.0-flash-exp-image-generation

Grok

文本：grok3

多模态模型：qwen-omni-turbo

视觉模型：GLM-4V-Plus-0111，GLM-4V-Flash

推理模型：GLM-Zero-Preview

图片生成：CogView-4-250304，CogView-Flash

视频生成：CogVideoX-2，CogVideoX-Flash

视觉模型：Doubao-1.5-vision-pro-32k

图片生成：通用2.1模型（文生图）

视频生成：Seaweed

图片生成：image-01

推理：hunyuan-t1

多模态：GPT4.5

推理：claude-3.7-sonnet-thinking

推理：gemini-2.0-flash-thinking，gemini-2.5-pro

图片生成：gemini-2.0-flash-exp-image-generation