deep发展历程

最新推荐文章于 2025-03-13 21:54:42 发布

菜菜-plus

最新推荐文章于 2025-03-13 21:54:42 发布

阅读量504

点赞数 1

文章标签： deepseek历史

本文链接：https://blog.csdn.net/QQ903275718/article/details/145588355

版权

                    
                        
                    
                    DeepSeek是一家专注于通用人工智能（AGI）和大语言模型（LLM）的科技公司，其发展历程如下： 成立背景
2023年7月：DeepSeek由知名量化私募巨头幻方量化创立，总部位于杭州。公司由梁文锋带领团队成立，专注于通用人工智能（AGI）与大模型研发，初期资金由幻方量化支持。
2023年11月2日：DeepSeek发布了首个开源代码大模型DeepSeekCoder，支持多种编程语言的代码生成、调试和数据分析任务。
2023年11月29日：推出DeepSeek LLM，包含670亿参数，支持多种自然语言任务。 技术突破与市场拓展
2024年1月：DeepSeek LLM发布，使用2万亿字符双语数据集预训练，性能超越LLaMA-2。
2024年5月：发布DeepSeek
 V2，采用Mixture-of-Experts（MoE）架构，显著降低了推理成本，引发行业内价格战。
2024年12月：DeepSeek V3发布，成为全球首个全开源MoE模型，以高性能、低成本受到全球关注。
2025年1月：DeepSeek R1发布，性能与OpenAI的o1相当，且完全开源。 市场影响
DeepSeek的出现打破了美国在AI领域的垄断，其开源模式和高性能模型在全球范围内引起广泛关注。
DeepSeek的低价策略和高性能模型使其在国内外市场迅速崛起，成为与OpenAI竞争的重要力量。 最新动态
2025年1月31日：DeepSeek R1模型登陆NVIDIA NIM平台，并被亚马逊和微软接入。
2025年2月5日：DeepSeek R1、V3和Coder等系列模型已上线国家超算互联网平台。
DeepSeek的发展历程展现了其在技术创新和市场拓展方面的强大实力，其开源策略和高性能模型为全球AI领域带来了新的机遇和挑战。