本篇内容将盘点2025年Q1所有的主流大模型更新汇总
-
通义千问(国内大模型劳模)
-
推理模型:QWQ-32B,QWQ-Plus
-
概括:32B推理模型性能比肩deepseek-r1。QWQ-32B为开源版,QWQ-Plus为商业版,性能和价格更佳。
价格:QWQ-Plus:输入1.6元/百万tokens,输出4元/百万tokens
-
视觉模型:qwen2.5-vl-72b-instruct, qwen2.5-vl-32b-instruct
概括:通义千问旗舰款视觉推理模型。达到行业顶尖水平,在视觉agent,多国语言OCR有突出优势,并且支持图像坐标标识。
价格:
qwen2.5-vl-72b-instruct:输入16元/百万tokens,输出48元/百万tokens
qwen2.5-vl-32b-instruct:输入8元/百万tokens,输出24元/百万tokens
-
文本模型:Qwen-Max
概括:通义千问旗舰款大模型,性能超越初版deepseek v3,最大上下文32K
价格:输入2.4元/百万tokens,输出9.6元/百万tokens
长文本模型:qwen2.5-14b-instruct-1m,Qwen-Turbo
概括:通义千问长文本模型,支持1M上下文。性能不是行业顶尖,价格便宜,性价比高
价格:
qwen-turbo:输入0.3元/百万tokens,输出0.6元/百万tokens
qwen2.5-14b-instruct-1m:输入1元/百万tokens,输出3元/百万tokens
-
多模态模型:qwen-omni-turbo
概括:通义千问多模态模型,支持音频,文字,图片和视频的输入,输出为文字和音频。最大上下文32K。
价格:不同的数据输入输出价格不同,参考官方文档
-
图片生成:wanx2.1-t2i-plus,wanx2.1-t2i-turbo
概括:通义千问最新版文生图模型,plus为旗舰款,turbo为轻量版。
价格:
wanx2.1-t2i-plus:0.14元/次
wanx2.1-t2i-turbo:0.2元/次
-
视频生成:wanx2.1-i2v-plus,wanx2.1-i2v-turbo,wanx2.1-t2v-plus,wanx2.1-t2v-turbo
概括:通义千问最新版视频生成模型,有文生视频和图生视频版本,plus为旗舰款,turbo为轻量版。
价格:
wanx2.1-i2v-plus,wanx2.1-t2v-plus:0.7元/秒=3.5元/5秒
wanx2.1-i2v-turbo,wanx2.1-t2v-turbo:0.24元/秒=1.2元/5秒
智谱(赛博菩萨)
-
文本模型:GLM-4-Air-0111
概括:智谱超值款文本模型,性能提升,价格降低一倍
价格:输入和输出0.5元/百万tokens
-
视觉模型:GLM-4V-Plus-0111,GLM-4V-Flash
概括:智谱视觉模型,GLM-4V-Plus-0111为旗舰款,价廉物美。GLM-4V-Flash为免费款,可以满足基础性任务。
价格:
GLM-4V-Plus-0111:输入和输出4元/百万tokens
GLM-4V-Flash:免费
-
推理模型:GLM-Zero-Preview
概括:智谱版推理模型,目前还是预览版
价格:输入和输出10元/百万tokens
-
图片生成:CogView-4-250304,CogView-Flash
概括:CogView-4-250304是国内高性价比的文生图模型,新版本对文字显示支持较好。CogView-Flash是免费文生图模型,性能尚可。
价格:
CogView-4:0.06元/次
CogView-Flash:免费
-
视频生成:CogVideoX-2,CogVideoX-Flash
概括:CogVideoX-2是国内性价比极高的文生视频模型。CogVideoX-Flash是免费视频生成模型。
价格:
CogVideoX-2:0.5元/次
CogVideoX-Flash:免费
-
豆包
-
文本模型:Doubao-1.5-pro-32k,Doubao-1.5-pro-256k,Doubao-1.5-lite-32k
概括:豆包更新1.5版本模型,性能达到行业顶级水平,价格便宜。
价格:
Doubao-1.5-pro-32k:输入0.8元/百万tokens,输出2元/百万tokens
Doubao-1.5-pro-256k:输入5元/百万tokens,输出5元/百万tokens
Doubao-1.5-lite-32k:输入0.3元/百万tokens,输出0.6元/百万tokens
-
视觉模型:Doubao-1.5-vision-pro-32k
概括:行业顶级的视觉模型,同时价格极低。
价格:输入3元/百万tokens,输出9元/百万tokens
-
图片生成:通用2.1模型(文生图)
概括:提升结构准确度和美感,重点支持中英文字符渲染
价格:0.2元/次
-
视频生成:Seaweed
概括:豆包的视频生成模型,支持文生视频和图生视频,用chat接口调用,支持高度自定义的视频输出。
价格:视频生成有复杂的计算公式
- Deepseek
- deepseek-r1
概括:这个模型大家都很熟,2025年1月20日发布的deepseek r1,性能达到了当时最好的模型o1的水准,但是价格便宜了30倍并且开源。引起国际社会轰动。
价格:输入4元/百万tokens,输出16元/百万tokens
-
deepseek-v3-0324
概括:大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。
价格:输入2元/百万tokens,输出8元/百万tokens
-
MiniMax
-
文本:Minimax-Text-01
概括:综合性能强,长文本能力目前第一,1M上下文
价格:输入1元/百万tokens,输出8元/百万tokens
-
图片生成:image-01
概括:性价比极高的文生图模型
价格:0.025元/每次
-
腾讯混元
-
文本:hunyuan-turbos
概括:官方推荐的高性价比文本模型,上下文32K
价格:输入0.8元/百万tokens,输出2元/百万tokens
-
推理:hunyuan-t1
概括:腾讯混元版的推理模型
价格:输入1元/百万tokens,输出4元/百万tokens
-
文心一言
-
多模态:ernie-4.5-8k-preview
-
概括:百度的新一代旗舰多模态模型,目前支持文本+图片输入,文本输出。预览版上下文为8K。
价格:输入4元/百万tokens,输出16元/百万tokens
-
Kimi
-
多模态:kimi-latest
-
概括:kimi最新版模型的API,支持图片+文字输入。上下文可达128K。
价格:输入和输出60元/百万tokens
-
OpenAI
-
推理:o3-mini
-
概括:OpenAI针对deepseek-r1推出的推理模型,部分性能比o1更强但价格接近deepseek-r1
价格:输入10元/百万tokens,输出40元/百万tokens
-
多模态:GPT4.5
概括:OpenAI最新推出的旗舰款模型。性能更强,但是价格巨贵,劝退路人。
价格:输入600元/百万tokens,输出1200元/百万tokens
-
Anthropic
-
多模态:claude-3.7-sonnet
概括:最新版本的claude,各方面性能都有所提升,设计前端页面审美很在线,目前claude似乎在专注于编程和agent这个领域。
-
推理:claude-3.7-sonnet-thinking
概括:claude3.7的推理版
价格:输入22元/百万tokens,输出110元/百万tokens
-
Gemini
-
多模态:gemini-2.0-flash, gemini-2.0-pro
概括:谷歌在第一季度发布了gemini2.0系列的模型,pro代表着旗舰款,而flash代表快速和轻量,实际上flash的性能也不错,尤其是在识图方面。pro版目前还是在实验阶段,尚未收费。gemini-2.0-flash的性价比则是相当优秀。谷歌的模型都支持多模态的输入,上下文为1M。
价格:
gemini-2.0-flash-001:输入0.8元/百万tokens,输出3.2元/百万tokens
gemini-2.0-flash-lite:输入0.6元/百万tokens,输出2.4元/百万tokens
gemini-2.0-pro:免费
-
推理:gemini-2.0-flash-thinking,gemini-2.5-pro
概括:gemini也是早早推出了推理模型gemini-2.0-flash-thinking,而在3月底迭代了gemini-2.5-pro推理模型,号称当时最强,超越GPT4.5和o3-mini。此模型支持多模态输入,上下文达到1M。目前处于实验阶段,尚不收费。

价格:免费
-
图片生成:gemini-2.0-flash-exp-image-generation
概括:gemini推出的图片生成和编辑模型,说两句话就可以让图片变样,在多模态模型领域中比较新颖,因为增加了多模态的输出能力。由于是实验阶段,此模型暂不收费。
价格:免费
-
Grok
-
文本:grok3
概括:马斯克的XAI推出的旗舰款模型。性能短暂霸榜。还是一款不错的模型,只能说现在实在太卷了。
以上模型都可以在高通智匠的客户端,小程序,网页版上使用。也可以在开发者平台上调用API。