DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT” model ？

猫头虎

已于 2024-12-30 17:03:44 修改

阅读量6.3k

点赞数 24

文章标签： chatgpt AIGC AI-native bard 文心一言 gpt agi

于 2024-12-30 17:03:17 首次发布

转载必须标明来源：猫头虎技术团队，其他疑问搜： CSDNWF

本文链接：https://blog.csdn.net/qq_44866828/article/details/144830178

版权

AI人工智能技术专栏专栏收录该内容

115 篇文章

订阅专栏

📅 12月26日，杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）正式发布了全新系列模型 DeepSeek-V3。官方表示，该模型多项评测成绩超过了诸如 Qwen2.5-72B 和 Llama-3.1-405B 等顶尖开源模型，在性能上更是与闭源模型 GPT-4o 和 Claude-3.5-Sonnet 平分秋色。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

作者简介

作者名片 ✍️

博主：猫头虎
全网搜索关键词：猫头虎
作者微信号：Libin9iOak
作者公众号：猫头虎技术团队
更新日期：2024年12月29日
🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能！

文末加入我们AI共创交流团队 🌐

正文

🌟 DeepSeek-V3：性能真的强吗？

1️⃣ 官方亮点宣称

根据官方技术论文，DeepSeek-V3的训练成本为 557.6万美元，远低于 GPT-4o 等闭源模型的 1亿美元，但依旧实现了与其性能相当的效果：

多项评测超越对手：DeepSeek-V3 在多个基准测试中表现优异，压制了诸如 Qwen 和 Llama 等顶尖开源模型。
开源+低成本：相较于闭源模型，其成本和开源特性让开发者们更容易接触并使用。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

2️⃣ 真实体验：它真的行吗？

笔者在第一时间体验了这个备受瞩目的模型，以下是几点感受：

语言生成能力：DeepSeek-V3 在复杂对话和技术性问题上的回答颇具深度，但偶尔会出现小瑕疵。
理解上下文的能力：长文本追踪和上下文理解较强，能够应对跨段对话。
趣味性意外Bug：当被问到“你是哪家大模型？”时，模型直接回答 “ChatGPT”，让人啼笑皆非。这个Bug至今尚未修复。

📝 吐槽：一个自诩“打破大模型格局”的顶尖开源模型，却犯了这种“认亲”级错误，似乎和它的“顶尖”称号有些不匹配。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

🤔 DeepSeek-V3真的能与GPT-4o比肩？

让我们通过几个数据来直观了解：

模型	训练成本（美元）	开源/闭源	评测成绩	关键优势
GPT-4o	1亿	闭源	世界顶尖，行业标杆	超高准确性和稳定性
Claude-3.5-Sonnet	未公开	闭源	通用能力强	人性化对话能力
Qwen2.5-72B	未公开	开源	出色的语言理解和生成	国内领先模型
DeepSeek-V3	557.6万	开源	超越Qwen等，接近GPT-4o	成本低、可定制化