2024年大模型使用总攻略

最新推荐文章于 2025-03-14 11:15:06 发布

AGI学习社

最新推荐文章于 2025-03-14 11:15:06 发布

阅读量1.3k

点赞数 15

文章标签：人工智能 AIGC 大数据深度学习 jmeter

本文链接：https://blog.csdn.net/2401_85773741/article/details/144966992

版权

2024年，大模型市场竞争异常激烈，各厂商纷纷推出新模型并调整价格策略。本文将模型分为几类进行盘点，并推荐实用模型。

1. 免费模型

GLM-4-FLASH（智谱）：比较有名的免费模型，128K上下文，适合快速处理简单问题。
GLM-4V-FLASH（智谱）：免费视觉模型，基础任务表现良好。
hunyuan-lite（腾讯混元）：256K上下文，MOE架构，适合大文件摸底。
ernie-speed-128k（百度）：基础免费模型。
Spark Lite（讯飞星火）：免费模型，适合基础任务。

2. 高性价比模型

deepseek-chat：V3版本性能甚至比肩claude3.5 sonnet，价格仅1元/百万tokens。行业价格战的开启者。
GLM-4-AIR（智谱）：128K上下文，最早响应价格战的模型，年底最后一天价格调至价格降至0.5元/百万tokens。
qwen-plus（通义千问）：即Qwen2.5 72B，价格便宜，综合性能强。
doubao-pro-32k：最早响应价格战的一款模型，32K上下文，多次迭代后性能提升。
abab6.5s（MiniMax）：综合能力强，价格实惠。
ernie-3.5-128k（百度）
yi-lightning（零一万物）
baichuan4-air（百川智能）：性价比高。
gpt4o-mini、gemini-flash-1.5：国外高性价比模型，性价比略逊于国产头部模型。

3. 视觉模型

GLM-4V-PLUS（智谱**）**：旗舰视觉模型，支持视频识别，性能对标5月份GPT4o，价格10元/百万tokens。国内最早的高质量视觉模型之一，然而现在竞争激烈，不如刚开始独树一帜。
GLM-4V-FLASH（智谱**）**：免费视觉模型，基础任务表现良好，拥有不俗的生产力。
doubao-vision-pro-32k：新的性价比王者，输入3元/百万tokens，输出9元/百万tokens，推荐使用。
qwen-vl-max（通义千问）：旗舰视觉模型，基于qwen2-vl开发，原20元/百万tokens，年底最后一天降价，输入3元/百万tokens，输出9元/百万tokens。
abab6.5s、abab7（MiniMax）：原生支持识图。abab6.5s的识图成本低，但是下有免费模型，上有众多模型，没有特别的优势区间。
**hunyuan-vision（腾讯混元）、yi-vision（零一万物）：**为国产视觉模型。
**gpt4o、claude3.5 sonnet、gemini 1.5 pro：**国外模型基本都支持识图，在复杂识图场景仍具优势。

4. 文档交互模型

hunyuan-lite：256K上下文，免费，适合大文件摸底。先通过免费模型了解文档大致情况以及文档的token数量，再进一步使用其他模型。
qwen-plus：128K的上下文，优秀的综合性能，并且具备缓存命中功能，缓存命中时输入价格降低40%。
deepseek：V3版本性能还更优于qwen-plus。最早实现缓存功能的国产模型，缓存命中后成本降低10倍，使得文件交互极其便宜，唯一不足是最大上下文64K。
abab6.5s：245K上下文很长，价格便宜，读文档综合性能优异。复杂推理不如qwen-plus和deepseek。

5. 拟人模型

abab6.5s：适用于拟人化对话场景，优秀的指令遵循能力以及极快出token速度，更适合实时语音交互。
doubao-pro-32k-character：豆包的角色扮演专精模型，拟人化表现优秀。

6. 推理专注模型

o1（OpenAI）：率先发布思维链推理模型，行业标杆，价格昂贵。
gemini 2.0 flash thinking experimental（谷歌）：限时免费。
QWQ、QVQ（通义千问）：文字和视觉识别版，专注推理应用场景，QVQ在研究生考试题上表现优异。价格实惠。
GLM-Zero-Preview（智谱）：10元/百万tokens，2024年最后一天发布。

7、推荐模型与总结

qwen-plus：高性价比，综合性能强，六边形战士。
deepseek-chat：目前的V3版本可能是国内性价比最高的模型。
abab6.5s：综合能力强，价格实惠，出token速度快，拟人表现优秀，适合AI智能硬件。
doubao-vision-pro-32k：视觉模型黑马，性价比高。
GLM-4V-FLASH：全球首个官方免费视觉模型，基础任务如识图，文字识别，格式化输出表现良好，具有生产力。
hunyuan-lite：256K MOE免费模型，适合大文件摸底以及简单任务。
GPT4o：依然是行业标杆，优秀的综合能力，支持多模态，支持16K最大输出。
Claude3.5 Sonnet：被认为是目前大模型能力天花板，在代码及编程场景甚至不输o1。

大模型更新迅速，日新月异，本文仅为2024年底的盘点，未来可能发生变化。希望本文能为大模型的技术和应用提供一些参考。

现在大家可以在高通智匠（MindCraft AI）的客户端/小程序上体验以上所有模型，也可以在开发者平台上调用API，官方同价。

今天只要你给我的文章点赞，我私藏的大模型学习资料一样免费共享给你们，来看看有哪些东西。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】