文 / 大力财经
作者 / 魏力
在杭州余杭区某栋低调的写字楼里,一位穿着格子衬衫的 85 后正在重构中国 AI 的未来。他拒绝资本的“招安”,烧掉数亿元研发经费只为验证一个数学猜想;他带领 139 人的团队,在万卡集群的轰鸣声中,与 OpenAI 进行着一场“不对称战争”。
他就是梁文锋,DeepSeek 的创始人,一个被同行称为“AI 界扫地僧”的技术偏执狂。梁文锋的目标很明确:用开源的方式,推动AI技术的自主创新,让中国在全球科技领域占据一席之地。
01
从数学顽童到“AI 布道者”
1985 年出生于湛江教育世家的梁文锋,从小展现出对数学的极致热爱。吴川一中的老师至今记得,这个总爱用草稿纸演算数论的少年,曾在全国奥赛中斩获银牌。浙江大学电子信息工程本硕连读期间,他的实验室成为同学眼中的“神秘地带”——墙上贴满的不是明星海报,而是矩阵公式与神经网络结构图。
这种对数学的痴迷,在 2008 年金融危机期间迎来转折。当同龄人在焦虑就业时,他带着 7 人团队开发出基于机器学习的量化交易模型,三个月实现 500% 收益。这段经历让他意识到:数学公式不仅能解释世界,更能创造价值。
2013年,怀揣着10万元本金,梁文锋正式踏入投资市场。在最初的日子里,市场的波动如同汹涌的海浪,一次次冲击着他的信心和策略。但他没有退缩,日夜钻研市场数据,不断优化自己的量化策略。
2015 年创立幻方量化时,梁文锋做出两个惊世骇俗的决定:自建超算中心,用 GPU 集群替代传统服务器;将 AI 策略开源。前者让幻方在 2021 年管理规模突破千亿,后者却因市场回撤引发争议。面对媒体质疑,他在内部信中写下:“我们不是在做对冲基金,而是在训练 AI 的‘数学直觉’。”
这种将商业工具升华为技术实验的思维,为 DeepSeek 埋下伏笔。2022 年,他带着幻方核心团队转身投入 AGI 研究,临行前留下一句话:“量化交易只是开胃菜,AGI 才是正餐。”
02
坚持普惠AI 理念
在行业疯狂追逐 Llama 架构变现时,DeepSeek 选择重构模型结构。当投资人质疑“成本增加 4 倍是否值得”,梁文锋反问:“如果中国 AI 永远跟随,那我们的孩子将生活在谁的算法世界里?”这种“技术正确性优先于商业可行性”的价值排序,贯穿 NSA 稀疏注意力架构的研发全程——该架构将推理成本降至 GPT-4 Turbo 的 1/70。
其拒绝腾讯、阿里投资的深层逻辑,在于维护组织的“技术纯粹性”。如同他在总理座谈会上强调的:“中国 AI 不能永远跟随,必须找到自己的‘根技术’。”
从幻方百亿超算到 DeepSeek 模型开源,梁文锋的决策始终着眼于 20 年后的技术格局。2024 年他在内部邮件预言:“国内模型结构与国外存在两代差距。”随后启动“NSA-2030”计划,布局下一代认知架构研究。
面对行业价格战时,他坚持“普惠 AI”理念,将模型部署成本降至行业 1/100。这种看似“反商业”的行为,实则是在构建技术生态——如同 Linux 抗衡 Windows 的开源策略,为中国 AI 预埋基础设施。
03
DeepSeek不需要完美的简历
在 DeepSeek 的招聘系统里,学历标签被彻底摒弃。HR 收到的指示是:“寻找那些在深夜思考‘AI 能否理解量子物理’的人。”团队中有普林斯顿博士做数据标注,也有二本院校学生主导算法优化。这种“去精英化”的筛选机制,本质是在构建价值观同频的“技术远征军”。
梁文锋在内部培训会上说:“我们不需要‘完美简历’,只需要‘燃烧的好奇心’。”这种认知密度策略,让 139 人的团队创造出超越千人团队的创新效率。
在 DeepSeek 的机房,每度电都被赋予“认知使命”。梁文锋要求算力利用率必须保持在 96% 以上,同时向高校和公益项目开放 20% 算力。这种看似矛盾的策略,实则统一于“算力为认知服务”的理念——资源存在的意义,在于推动人类认知边界的拓展。
当同行惊叹其算力成本控制时,他在技术博客中揭秘:“我们不是在省电费,而是在计算‘每毫焦能量能推动多少认知进步’。”
DeepSeek 的 App 只有 2 - 3 人维护,B 端部署近乎免费。这种“去商业化”策略,让投资人困惑不解。但梁文锋看得更远:“我们的产品是技术验证的载体,而非盈利工具。”当市场追捧“能写文案的 AI”时,他却要求团队将模型性能对标 GPT-4o,“我们要解决的不是商业需求,而是智能本质问题。”
04
心理动因:认知焦虑与超越性追求
在一次闭门会议上,梁文锋展示了一组数据:中国 AI 专利中 92% 是应用型,基础架构专利不足 5%。这种代差转化为强烈的紧迫感:“如果我们不原创,十年后中国将成为 AI 的‘数字殖民地’。”
这种焦虑在 2023 年达到顶峰,他在给团队的公开信中写道:“我们不是在与时间赛跑,而是在与人类认知的边界赛跑。”
梁文锋的决策动机呈现三重超越性:
技术超越:将 AGI 视为“人类智能本质”的探索,而非商业工具;
组织超越:构建“无层级、无计划”的创新生态,挑战传统科层制;
文化超越:通过模型开源推动技术平权,对抗技术垄断。
2025 年身家暴涨后仍保持极简生活,办公室仅一张办公桌、三个书架。他在接受《财经》采访时说:“资本是创新的燃料,不是人生的目的地。”
05
未来启示:中国 AI 的第三条道路
梁文锋的实践,正在探索中国 AI 发展的第三条道路:既不同于硅谷的资本驱动,也异于国内某些企业的模式复制。这种模式的核心在于:
1. 技术原创性:以数学推导重构智能底层逻辑;
2. 组织创新性:打破科层制构建认知共同体;
3. 价值超越性:将技术探索与文明进步深度绑定。
当被问及“DeepSeek 的终极目标”时,他的回答充满哲学意味:“我们想证明,中国不仅能制造手机和高铁,还能创造改变人类认知的底层技术。”
结语:
在杭州的深夜,DeepSeek 的办公室依然灯火通明。梁文锋和他的团队正在用代码与数学公式,编织着中国 AI 的未来图景。这条路注定充满荆棘,但正如他在 NSA 论文致谢中所写:“献给所有在黑暗中寻找火种的人。”
当技术理想主义者的光芒穿透迷雾,或许我们终将见证,中国 AI 站在世界认知之巅的那一天。
当企业从“经验跟随”转向“第一性创新”,当国家对探索的态度从“只看成果”转变为“包容试错”,真正的变革才刚刚开始。
DeepSeek的成功并不只是一次技术上的胜利,更像是一场关于信念与勇气的启蒙:在通往未来的路上,年轻、理想和敢想敢干,或许才是最宝贵的“底层算力”。
推荐阅读: