Deepseek的发展历程

在人工智能技术浪潮汹涌的当下,众多企业和研究团队投身其中,试图在这片充满机遇与挑战的领域崭露头角。DeepSeek 作为中国人工智能领域的一颗新星,其发展历程充满了探索与突破,吸引着全球的目光。

DeepSeek 的故事要追溯到 2016 年 2 月,彼时,AI 爱好者梁文峰在浙江大学求学期间,经历过 2007 - 2008 年金融危机的洗礼,积累了一定交易经验的他,与他人共同创立了 High - Flyer 公司。起初,High - Flyer 专注于利用人工智能进行股票交易。在创业初期,他们使用的是基于 CPU 的线性模型进行交易。但随着技术的发展和对人工智能理解的加深,团队意识到 GPU 在深度学习领域的巨大潜力。于是,在 2016 年 10 月 21 日,High - Flyer 开始采用依赖 GPU 的深度学习模型进行股票交易,到 2017 年底,其大部分交易已由人工智能驱动。

2019 年,梁文峰正式将 High - Flyer 确立为一家专注于开发和运用 AI 交易算法的对冲基金公司。同年,为了满足日益增长的计算需求,梁文峰带领团队开启了名为 Fire - Flyer 的计算集群建设项目。该项目于 2020 年完工,耗费资金高达 2 亿元,集群内配备了 1100 个 GPU,数据传输速率达到 200Gbps。然而,随着业务的发展和对技术的更高追求,仅仅 1.5 年后,这个在当时堪称先进的计算集群就因无法满足需求而 “退役”。

2021 年,美国对中国实施芯片出口限制政策,这一举措在一定程度上给中国的人工智能产业发展带来了挑战。但梁文峰凭借着敏锐的市场洞察力和对技术发展趋势的准确预判,早在政策实施前就开始大量囤积英伟达的 GPU 芯片,据 36 氪报道,他成功购置了 10000 块英伟达 A100 GPU。也正是在这一年,High - Flyer 开启了第二代计算集群 Fire - Flyer 2 的建设,预算高达 10 亿元。

2022 年,Fire - Flyer 2 展现出了强大的计算能力,其资源利用率超过 96%,累计提供了 5674 万 GPU 小时的计算服务。值得一提的是,其中 27% 的计算资源还被用于支持公司外部的科学计算项目。当时,Fire - Flyer 2 拥有 5000 块 PCIe A100 GPU,分布在 625 个节点中,每个节点配备 8 块 GPU。由于当时所训练的模型能够在单块 40GB GPU 显存中运行,所以采用 PCIe 接口即可满足数据并行需求。但随着业务拓展和模型复杂度的增加,后续团队引入了 NV Links 和 NCCL 技术,以支持需要模型并行的更大规模模型训练。

2023 年 4 月 14 日,High - Flyer 做出了一个具有战略意义的决定,宣布成立一个专注于研究和开发人工智能工具的通用人工智能实验室,且该实验室的业务与 High - Flyer 的金融业务相互独立。这一决策为 DeepSeek 的诞生埋下了伏笔。同年 7 月 17 日,在 High - Flyer 的投资与支持下,这个实验室正式独立成为一家公司,取名为 DeepSeek。尽管在成立初期,由于人工智能领域投资风险高、回报周期长等因素,风险投资公司对 DeepSeek 持谨慎态度,不太愿意提供资金支持,但 DeepSeek 团队凭借着坚定的信念和对技术的执着追求,依然稳步推进项目。

2023 年 11 月 2 日,DeepSeek 推出了其首款模型 ——DeepSeek Coder,这一模型的发布标志着 DeepSeek 正式踏入人工智能模型开发领域。紧接着,在 11 月 29 日,DeepSeek 又发布了 DeepSeek - LLM 系列模型,在人工智能领域引起了广泛关注。这些模型的出现,展示了 DeepSeek 在自然语言处理方面的技术实力,为后续的发展奠定了坚实基础。

2024 年 1 月 9 日,DeepSeek 进一步丰富了其模型产品线,发布了两款 DeepSeek - Moe 模型(基础版和其他版本)。而在 5 月推出的 DeepSeek - V2 版本,更是在人工智能市场掀起了波澜。DeepSeek - V2 以其出色的性能和极具竞争力的价格,赢得了市场的青睐,甚至被外界称为 “人工智能界的拼多多”。其高性能与低价格的组合,迫使字节跳动、腾讯、百度等中国科技巨头在人工智能产品定价方面做出调整,引发了一场人工智能市场的价格战,深刻改变了中国人工智能市场的竞争格局。

DeepSeek 在发展过程中,不仅在技术研发上取得了显著成果,在应用领域也不断拓展。在医疗健康领域,DeepSeek 能够通过医学影像进行疾病诊断,例如在新冠疫情期间,它协助通过 CT 扫描检测新冠病毒,为疫情防控提供了有力支持;在金融领域,DeepSeek 最初就应用于 AI 交易,如今它还能够检测欺诈活动,优化投资策略;在智慧城市建设方面,DeepSeek 通过分析交通流量、能源使用情况和公共安全指标等数据,为城市规划提供决策依据。

然而,DeepSeek 的发展并非一帆风顺。微软和 OpenAI 曾指控 DeepSeek 未经许可使用 OpenAI 的专有模型,称发现了 “蒸馏” 技术应用的证据。若此指控属实,将对人工智能领域的知识产权保护产生重大影响。同时,DeepSeek 在数据隐私和内容审查方面也面临着诸多争议。例如,有报道称其算法在某些地区会根据当地法规进行内容限制,这引发了部分人士对信息自由和隐私控制的担忧,澳大利亚在 2024 年 2 月甚至禁止政府设备使用该公司的技术。此外,2025 年初,DeepSeek 还遭遇了网络攻击,导致用户注册服务中断,尽管公司将其归因于 “大规模恶意攻击”,但此次事件仍引发了外界对其网络安全防护能力的质疑。

尽管面临着诸多挑战和争议,DeepSeek 凭借着其在技术研发上的持续投入和创新精神,在人工智能领域迅速崛起。从最初 High - Flyer 的 AI 交易探索,到如今成为全球瞩目的人工智能企业,DeepSeek 的发展历程充满了创新与突破。展望未来,DeepSeek 有望在人工智能治理、量子计算与自主系统等前沿领域继续探索,不断拓展人工智能的边界,为全球科技发展贡献更多力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值