- DeepSeek是一家专注于通用人工智能(AGI)和大语言模型(LLM)的科技公司,其发展历程如下: 成立背景
- 2023年7月:DeepSeek由知名量化私募巨头幻方量化创立,总部位于杭州。公司由梁文锋带领团队成立,专注于通用人工智能(AGI)与大模型研发,初期资金由幻方量化支持。
- 2023年11月2日:DeepSeek发布了首个开源代码大模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务。
- 2023年11月29日:推出DeepSeek LLM,包含670亿参数,支持多种自然语言任务。 技术突破与市场拓展
- 2024年1月:DeepSeek LLM发布,使用2万亿字符双语数据集预训练,性能超越LLaMA-2。
- 2024年5月:发布DeepSeek
V2,采用Mixture-of-Experts(MoE)架构,显著降低了推理成本,引发行业内价格战。 - 2024年12月:DeepSeek V3发布,成为全球首个全开源MoE模型,以高性能、低成本受到全球关注。
- 2025年1月:DeepSeek R1发布,性能与OpenAI的o1相当,且完全开源。 市场影响
- DeepSeek的出现打破了美国在AI领域的垄断,其开源模式和高性能模型在全球范围内引起广泛关注。
- DeepSeek的低价策略和高性能模型使其在国内外市场迅速崛起,成为与OpenAI竞争的重要力量。 最新动态
- 2025年1月31日:DeepSeek R1模型登陆NVIDIA NIM平台,并被亚马逊和微软接入。
- 2025年2月5日:DeepSeek R1、V3和Coder等系列模型已上线国家超算互联网平台。
- DeepSeek的发展历程展现了其在技术创新和市场拓展方面的强大实力,其开源策略和高性能模型为全球AI领域带来了新的机遇和挑战。
deep发展历程
最新推荐文章于 2025-03-13 21:54:42 发布