【一文读懂】DeepSeek的发展历史

DeepSeek: 先进的大语言模型技术公司

简介

DeepSeek(全称:杭州深度求索人工智能基础技术研究有限公司)成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)及相关技术。由知名私募巨头幻方量化支持,DeepSeek致力于通过数据蒸馏技术(Data Distillation)来提取更精炼、有用的数据,以提高其模型的性能。

公司背景

DeepSeek的总部位于浙江省杭州市,注册资本为1000万元人民币。公司法定代表人为裴湉,经营范围包括技术服务、技术开发、软件开发等。作为一家创新型科技公司,DeepSeek得到了幻方量化的大力支持,后者为其提供了强大的硬件支持,尤其是在A100芯片的储备方面。

发展历程

DeepSeek在成立后的短短时间内取得了显著的技术进展和市场关注。主要的产品和技术迭代如下:

2024年1月5日:发布DeepSeek LLM,包含670亿参数,并从零开始在2万亿token的数据集上进行训练。
2024年1月25日:发布DeepSeek-Coder,专注于代码生成和补全。
2024年2月5日:推出DeepSeekMath,基于DeepSeek-Coder-v1.5 7B,专注于数学相关任务。
2024年3月11日:发布DeepSeek-VL,一个开源视觉-语言模型,具有较高的视觉任务处理能力。
2024年5月7日:发布DeepSeek-V2,采用Mixture-of-Experts(MoE)架构,实现了显著的性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值