DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

最新推荐文章于 2025-07-11 09:59:44 发布

猫头虎技术团队

最新推荐文章于 2025-07-11 09:59:44 发布

阅读量1.2w

点赞数 3

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签： chatgpt bug 人工智能文心一言 bard AIGC

猫头虎@版权

本文链接：https://blog.csdn.net/weixin_61514920/article/details/144812111

人工智能专栏收录该内容

124 篇文章

订阅专栏

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT” model ？

📅 12月26日，杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）正式发布了全新系列模型 DeepSeek-V3。官方表示，该模型多项评测成绩超过了诸如 Qwen2.5-72B 和 Llama-3.1-405B 等顶尖开源模型，在性能上更是与闭源模型 GPT-4o 和 Claude-3.5-Sonnet 平分秋色。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

🌟 DeepSeek-V3：性能真的强吗？

1️⃣ 官方亮点宣称

根据官方技术论文，DeepSeek-V3的训练成本为 557.6万美元，远低于 GPT-4o 等闭源模型的 1亿美元，但依旧实现了与其性能相当的效果：

多项评测超越对手：DeepSeek-V3 在多个基准测试中表现优异，压制了诸如 Qwen 和 Llama 等顶尖开源模型。
开源+低成本：相较于闭源模型，其成本和开源特性让开发者们更容易接触并使用。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

2️⃣ 真实体验：它真的行吗？

笔者在第一时间体验了这个备受瞩目的模型，以下是几点感受：

语言生成能力：DeepSeek-V3 在复杂对话和技术性问题上的回答颇具深度，但偶尔会出现小瑕疵。
理解上下文的能力：长文本追踪和上下文理解较强，能够应对跨段对话。
趣味性意外Bug：当被问到“你是哪家大模型？”时，模型直接回答 “ChatGPT”，让人啼笑皆非。这个Bug至今尚未修复。

📝 吐槽：一个自诩“打破大模型格局”的顶尖开源模型，却犯了这种“认亲”级错误，似乎和它的“顶尖”称号有些不匹配。

DeepSeek V3被吹三天了，今天试了一下自称是“ChatGPT”？

🤔 DeepSeek-V3真的能与GPT-4o比肩？

让我们通过几个数据来直观了解：

模型	训练成本（美元）	开源/闭源	评测成绩	关键优势
GPT-4o	1亿	闭源	世界顶尖，行业标杆	超高准确性和稳定性
Claude-3.5-Sonnet	未公开	闭源	通用能力强	人性化对话能力
Qwen2.5-72B	未公开	开源	出色的语言理解和生成	国内领先模型
DeepSeek-V3	557.6万	开源	超越Qwen等，接近GPT-4o	成本低、可定制化