最近科技圈最火的当属DeepSeek了。那么DeepSeek是什么?它可以做什么?它为什么这么火?我们今天就来聊聊。
一、DeepSeek是什么?——AI领域的"六边形战士"
DeepSeek 是一家成立于2023年7月17日的深度求索公司开发的人工智能平台,由知名私募巨头幻方量化孕育而生。
团队大约140人。博士在读、应届以及毕业一两年的成员占很大一部分。
2024年年底,DeepSeek正式上线全新系列模型DeepSeek-V3首个版本并同步开源。在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了其他所有开源闭源模型。
2025年年初,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
这个集大语言模型、多模态交互、行业解决方案于一体的超级AI,正在重新定义人机协作的边界。