DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型

最新推荐文章于 2025-04-13 21:09:21 发布

大霸王龙

最新推荐文章于 2025-04-13 21:09:21 发布

阅读量7k

点赞数 42

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014158430/article/details/145385380

版权

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型，其在知识类任务上展现出了卓越的性能。以下是对DeepSeek的详细介绍，内容虽无法达到10000字，但会尽可能全面且深入地解析其各个方面。

一、公司背景与核心理念

DeepSeek的母公司深度求索由幻方量化在2023年4月创立。幻方量化是国内量化私募领域的巨头之一，管理规模庞大。DeepSeek的创立源于幻方量化的实际控制人梁文峰对AI的热衷。梁文峰本硕就读于浙江大学，攻读人工智能专业，毕业后成立了幻方量化，并在量化投资领域取得了显著成就。他坚信AI将改变世界，并致力于推动AI技术的发展。

DeepSeek是国内少数专注研究和技术的AI大模型公司，也是唯一一家未全面考虑商业化，甚至没有进行融资的公司。公司专注于做真正人类级别的人工智能，并发布了包括专家预言大模型、代码大模型、视觉语言模型在内的多个模型。DeepSeek希望形成一种生态，业界直接使用其技术和产出，而公司只负责基础模型和前沿的创新。

二、模型介绍与发展历程

DeepSeek的模型涵盖了多个领域，包括通用大模型、代码模型、数学模型、多模态大模型以及推理模型等。以下是对部分主要模型的详细介绍：

DeepSeek LLM：这是DeepSeek发布的通用大语言模型，具有7B和67B两种规模，均含基础模型（base）和指令微调模型（chat）。该模型在发布时即实现了与当时开源的同级别模型相当的性能。
DeepSeek Coder：这是专门针对编码任务开发的模型，能够更准确地理解用户的编码需求&

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大霸王龙 +V来点难题

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。