一.DeepSeek 介绍
DeepSeek 是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式 AI 模型。自 2023 年 7 月成立以来,DeepSeek 在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1。
二.DeepSeek 发展历程
2023 年 7 月:DeepSeek 成立,总部位于杭州。
2023 年 11 月 2 日:发布首个开源代码大模型 DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务。
2023 年 11 月 29 日:推出参数规模达 670 亿的通用大模型 DeepSeek LLM,包括 7B 和 67B 的 base 及 chat 版本。
2024 年 5 月 7 日:发布第二代开源混合专家(MoE)模型 DeepSeek-V2,总参数达 2360 亿,推理成本降至每百万 token 仅 1 元人民币。
2024 年 12 月 26 日:发布 DeepSeek-V3,总参数达 6710 亿,采用创新的 MoE 架构和 FP8 混合精度训练,训练成本仅为 557.6 万美元。
2025 年 1 月 20 日:发布新一代推理模型 DeepSeek-R1,性能与 OpenAI 的 o1 正式版持平,并开源。
2025 年 1 月 26 日:DeepSeek 登顶美区 App Store 免费榜第六,超越 Google Gemini 和 Microsoft Copilot 等产品。
三.公司背景
DeepSeek公司,全称杭州深度求索人工智能基础技术研究有限公司,是一家专注于开发开源大语言模型的创新型科技公司。它于2023年5月正式成立,总部位于浙江杭州。公司的核心团队由一群在人工智能领域具有深厚背景的专家组成,他们拥有丰富的研发经验和创新能力。
DeepSeek公司的愿景是让AI技术更加普惠,让更多人能够用上强大的AI工具。为了实现这一目标,DeepSeek不断投入研发资源,推动人工智能技术的创新和发展。同时,DeepSeek还积极与全球开发者合作,共同推动AI技术的进步。通过开源和社区支持,DeepSeek与全球开发者共同构建了一个开放、包容和创新的AI生态系统。