OpenAI 彻底慌了!建议美国封杀DeepSeek

近日,OpenAI向美国白宫科技政策办公室提交了一份15页的AI行动计划提案。主张禁止中国AI(尤其点名DeepSeek)进入美国及其盟国的市场,声称中国AI模型可能带来数据安全和隐私问题,表现出对中国极大的敌意。

这一切的根源,在于DeepSeek等中国高水平开源大模型的出现,使得原来强绑定的大模型生态出现了“解耦合”的趋势,对OpenAI未来生存发展构成了根本性的威胁。

DeepSeek凭借技术创新,扭转了中国AI落后于美国2到3年的局面。在这个时候我们更应该客观冷静地分析、找到差距和努力的方向,K哥来谈谈自己的观察与思考。


01

DeepSeek离OpenAI还有多远?

1、跟美国第一梯队大模型仍有差距

从综合测评角度看,DeepSeek在某些任务上的表现已经超越Meta的Llama系列,比如在自然语言处理的多项基准测试中,DeepSeek的开源模型展现了不俗的性能。但是,如果将其与OpenAI的GPT-4、Anthropic的Claude 3以及Google的Gemini 2.0 Flash放在一起比较,彼此之间的差距还是显而易见的。

以Gemini 2.0 Flash为例,这款模型不仅在推理任务中表现出色,同时成本也控制得更低。根据2024年Google I/O大会上公布的数据,Gemini 2.0 Flash的响应速度较之前提高了一倍。

训练成本也较上一代显著降低,这让它“最具成本效益”。除了整体性价比大幅提升外,Gemini 2.0 Flash支持视频、音频、文本深度融合的全模态数据处理能力,也是让目前主要局限在文本领域,尚未在多模态场景上发力的DeepSeek,略显逊色。

2、缩短了跟OpenAI的技术代际差

但话说回来,DeepSeek在技术上的创新突破,确实值得我们骄傲。过去,OpenAI的GPT系列几乎以代际碾压的姿态领先全球,尤其是GPT-3到GPT-4的技术飞跃,让其他玩家望尘莫及。但DeepSeek后来居上,以“算法优化替代算力堆砌”的技术路线,用更低的成本实现了对标GPT-4o1的推理能力。

更重要的是,DeepSeek选择了开源方向。这一策略不仅让DeepSeek自身技术快速迭代,更好地推动整个AI技术生态的发展。

3、打败OpenAI的不会是另一个OpenAI

DeepSeek的确在技术上做了很多创新,比如采用了混合专家模型(MoE)架构,将大模型拆分成多个“专家”,训练时分工协作,推理时按需调用,从而提高效率;还引入了多头潜在注意力机制(MLA),优化长文本处理效率,减少显存占用,等等。但另一个不能忽略的事实是,这些技术依然是依赖Transformer架构,并在此基础上进行创新和优化而来的。这种通过人工优化换取训练效率的做法,从本质上看仍是技术跟随路线。

但随着AI技术的发展,Transformer架构的局限性已逐渐显现。行业普遍认为,当模型的参数规模达到一定程度后,性能提升的边际收益可能会逐渐降低。对DeepSeek而言,在既有架构基础上,通过技术优化提升性能的空间,已经越来越小。换句话说,在这条技术路线上,用OpenAI的“招数”打败OpenAI的可能性是极低的。

历史经验表明,颠覆性的创新往往来自于对现有技术范式的突破。就像当年的苹果公司,通过重新定义手机的交互方式,彻底改变了手机行业的格局一样,AI领域同样需要这样的颠覆性创新,而不是在现有架构下的渐进式改进。AI大神Yann LeCun也曾指出,大模型未来的突破可能来自全新的计算范式。DeepSeek或其他大模型,要想真正从根本上超越OpenAI,可能要在技术路线上另辟蹊径,下大功夫了。

实际上中国AI公司已经开始尝试不同技术路线,比如国内大模型“六小虎”之一的MiniMax提出了“线性注意力“机制,尤其在长文本领域的表现非常突出,值得期待,而且MiniMax也在走开源路线。


02

DeepSeek的历史贡献

1、成为AI界“开源一哥”

目前来看,DeepSeek在AI开源领域的领头羊、一哥的位子算是无可争议的。OpenAI自GPT-3之后转向闭源,Meta和Mistral虽然坚持开源,但始终难以与GPT系列抗衡,直到DeepSeek的出现,才真正壮大了“开源派”实力。

DeepSeek推出的DeepSeek-V3、DeepSeek-R1等多个开源模型,在Hugging Face平台上受到开发者广泛欢迎,DeepSeek-R1更是很快收获万赞,成为该平台“近150万个模型中最受欢迎的大模型”。在GitHub同样如此,DeepSeek的开源项目在上线不到三个月,就吸引了超过10万次的fork和star,成为同期最热门的AI开源项目之一。

通过开源社区的反馈,DeepSeek形成了快速迭代的闭环,也让“长尾效应”得以彰显,吸引了大量开发者进入,这些开发者可能各自开发的应用受众较小,但汇聚起来却形成了一个丰富、完善的应用生态。

2、降低了大模型训练成本

DeepSeek的FlashMLA技术,让H800 GPU推理效率提升30%,显存带宽飙至3000GB/s。训练成本更是比传统的Transformer模型降低了约40%。更难能可贵的是,DeepSeek开源了它的技术和创新, 对于资源有限的中小企业来说是一个巨大的福音,能让他们以极低成本调用高性能模型,让更多企业能够参与到大模型的训练和应用中来。

不夸张地说,DeepSeek凭借在工程和算法上的创新,引发了一场低成本训练大模型的“普惠革命”,让整个AI产业大受其益。仅就这一点,DeepSeek绝对配得上世界范围内用户对它的推崇和喜爱。

3、王炸级Chatbot 体验升级

DeepSeek另一个引人注目的特色,是在C端用户体验上的显著突破。它推出的Chatbot不仅支持联网功能,还通过“Chain of Thought”(CoT)将推理过程透明化,让用户能直观看到模型如何一步步得出答案。这种透明化的体验,既增强了用户对AI的信任感,又符合了“用户中心”的设计理念,通过满足用户的好奇心和控制欲,提高了用户的满意度和忠诚度。

DeepSeek推理可视化的用户体验,惊艳的生成效果,再加上免费使用策略,堪称王炸组合,瞬间吸引大量C端用户。在没有任何营销推广的前提下,在全球范围内,创造了“上线7天,用户破亿”的AI应用神话。


03

以一己之力,改写中美AI竞争格局

1、动摇ChatGPT世界第一ChatBot的品牌心智

ChatGPT长期以来被视为AI科技的代名词,牢牢占据着“全球第一”Chatbot的“品牌心智”,被视为无可替代的存在。但它不菲的使用成本(基础版定价每月20美元)让不少用户望而却步。DeepSeek免费模式的推出,更是给了ChatGPT重重一击,其零成本策略迅速吸引了大量ChatGPT用户迁移。

彭博社数据显示,DeepSeek应用曾在全球140个市场下载量登顶,而ChatGPT的用户使用量则“此消彼长”般显著下滑。急得OpenAI创始人山姆奥特曼公开承认“压力很大”,甚至“想和DeepSeek的管理者见个面”。DeepSeek用事实和数据证明,ChatGPT并不是ChatBot世界必然的“第一”,更不会是用户选择的“唯一”。

2、给闭源大模型公司带来冲击

柯达因固守胶片,而错失数码时代;诺基亚因拒绝智能手机,而被市场颠覆;这些都已经成为商业史上因不能顺应趋势、不肯变革,而导致一败涂地的经典案例。如今,很多闭源大模型公司,也在经历“变与不变”的艰难抉择。

面对DeepSeek开源的成功,一些闭源大模型公司不得不重新审视自己的战略。开源模式对他们的冲击,不仅体现在技术层面,还体现在市场层面。技术上,闭源的技术神秘感被打破,甚至连用户体验都被开源的DeepSeek所超越。这样下去,用户对开源技术的接受度和信任度只会越来越高,面对这一尴尬处境,还“犹抱琵琶半遮面”的闭源公司又该如何应对?别忘了,用户可是会用脚投票的。

再看市场层面,在最近的财报季中,多家闭源AI公司都提到了开源趋势对它们业务的影响,并表示将加快开源化进程。有些动作快的公司,已经先下手为强了。比如OpenAI已经宣布对部分大模型开源,Anthropic也表示将开源部分核心模块,Google也跟进加速推进Gemini开源计划。

闭源大模型公司的这种“群体应激反应”式的自救,不是出于良心发现,而是因为闭源模型的倒逼,某种程度来说,是DeepSeek以一己之力,让开源与闭源博弈的天平,向后者倾斜。从这个角度看,说DeepSeek 重塑了AI产业格局,一点也不为过。


04

方向是星辰大海

1、DeepSeek目标是AGI

不管是对人还是对企业来说,要想做成大事,必须要敢试错,要有底气。而对DeepSeek来说,他最大的底气就是背后的母公司幻方量化。DeepSeek背靠幻方量化,财大气粗,资金储备充裕,不用为“柴米油盐”一类的小问题或短期利益所影响。他们有足够的战略定力,专注于人工智能的基础性研究,并剑指更宏大的AGI领域。

DeepSeek在今年2月份已经宣布,成立探索AGI团队,并计划开源5个代码库,以推动AGI研究。这些都彰显了他们在AGI领域投入的决心和战略上的雄心。念念不忘,必有回响,更何况他们有雄厚的财力,和长期主义的远见,他们最需要的,也许只是时间。

2、创新与开源双引擎驱动

如果把格局再“升维”一下,DeepSeek的未来目标,也许并不是与OpenAI等AI巨头的短期较量,还有更高视野下的地缘政治博弈。如今算力即国力,AI技术领先,就代表未来整个科技、生产制造等领域的全面领先。DeepSeek坚持“创新+开源”双引擎驱动,为的就是在这一事关“国运”的关键领域保持领先,卡好位置。

而事实也证明,DeepSeek这一策略是正确的,这一模式不仅有助于打破美国的AI霸权和技术垄断,也为全球AI生态注入了新活力,并最终帮助中国AI从“规则接受者”跃升为“标准共治者”,意义深远,影响重大。

写到这里,K哥除了想表达对DeepSeek的敬意外,还想说的是:在这个时代,任何领域都很难再有“象牙塔”,只有车库文化与社区共创精神才能更激励人心,也唯有如此,企业或个人的生命,才会更有生存的韧性和突破的张力。DeepSeek的崛起,不是终局,只是序章,让我们一起期待更多属于我们的“DeepSeek”故事。

精选好文:

1、烧掉 700 亿学费后,中国企业终于懂了

2、DeepSeek梁文锋:亲自写代码,没有KPI...

3、CIO被裁!花500万买的BI系统,打水漂

4、DeepSeek的7个技巧,90%的人不知道

5、经济越不好,越要疯狂做这5件事


作者| Mr.K   

编辑| Emma

号主简介

Mr.K,黄哲铿,企业数字化转型专家,「顿悟山丘」创始人,科技博主,曾担任海尔、中通快递、1药网技术高管,著有《技术人修炼之道》《技术管理之巅》。分享:个体成长、科技趋势、数字化转型、商业洞察。

 -  END - 

关注就送《清华DeepSeek研究》资料合集

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值