一文看懂DeepSeek的中国式创新一二三(三)

不用大篇幅技术词汇
不搞精神胜利和闭眼狂喷
想用客观的“人话”说一说自己理解的DeepSeek中国式创新

续更,就在写的当天,英伟达、微软布接入DeepSeek,华为上线基于昇腾云服务的DeepSeekR1/V3推理服务。一直猜测已经印证了。

  

  
七、
DeepSeek强不强、新不新、抄没抄,各有各的看法。
我说下自己对DeepSeek创新的评价:

从技术创新看,DeepSeek并没有颠覆AI技术路线。甚至在创新程度上,远未达到核弹级水平
之前AI发展史的铺垫可以看到,那些重要成果,是具有历史意义的突破。RNN、BP、LSTM、DL……要么是技术引领方向,要么是路线理念开创。

DeepSeek最具价值的创新,在于研究过程中巧妙的设计、多种技术融合、同等强劲甚至略有领先的性能,以及体现出大幅提升的效率

AI界的领头羊OpenAI在2024年5月推出GPT-4o,9月发布推理模型GPT-o1。
主要对手Anthropic公司2024年发布最新模型Claude 3.5 Sonnet。
2024年友商这几款产品的性能也一直在沿着平滑梯度升级。

只是DeepSeek这一轮短时间内费效比的提升幅度,比太平洋对岸友商快了太多,怎能让人不侧目。

     

从探索方向看,DeepSeek最为称道的是坚持算法。
大语言模型有一个叫做规模化法则(Scaling Law)也称尺度定律,被业界认为是大模型预训练第一性原理。

简单来说,就是随着模型大小、数据集大小和计算资源的增加,堆越算力和数据,获得的收益就会越大。俗称越多越牛X。
然而,随着模型规模的增大,每增加相同数量的参数或计算资源,获得的性能提升逐渐减少,这叫做边际效益递减现象。

俗称,卷不动了

不是其它友商没有在做算法,财大气粗、兵强马壮的OpenAI、Meta、Anthropic,都是不缺资源、不缺人才的主。

像DeepSeek这么年轻又小的团队,敢于打破传统尝试算法优化,并且做的通、做的好。这才是真的长脸。退一步说,就算DeepSeek做出的V3和R1略有不及友商的最新版本,那已经是了不起的成就了。

   

从历史进程看,集中在语言大模型(LLM)竞赛的各个团队,很像二十年前我玩的一款MMORPG游戏——魔兽世界(WOW)

魔兽世界游戏中,玩家组成40人(或25人)的团队进入一个大型副本空间,一步步探索地图、清理小怪,击杀一个个守着关口的BOSS。
一直以来,美国、欧洲、亚洲地区各个服务器里的优秀公会,在版本开放高级副本后,都会组织团队在竞速击杀,看谁能用最少的时间通关。

但是,人工智能这个副本,路是未知的,最终BOSS在哪里也是未知的,只有一步步的探索。
也许OpenAI的ChatGPT拿下第一个BOSS的世界首杀(FD,First Down),但其它公会也在第二、第三个BOSS上你追我赶,没有谁是次次FD。

那么今天,国服非知名公会DeepSeek,克服了刻意制造服务器延迟(芯片制裁),在极短时间内(成立不到1年半),集合一批新玩家组成团队(211TOP高校应届生等),装备等级和药品补给落后(成本显著低于友商)的前提下,世界首杀第N个BOSS。
并且DeepSeek创设新的击杀方法,击杀后公布技术文档,制作击杀视频对全球玩家开放(开源)。

未来,会有更多的美服和国服公会拿到后面BOSS的首杀。
通向AI最终BOSS可能会像迷宫一样,走其它探索击杀的不同道路。
但是,这都不妨碍DeepSeek在这一轮书写浓墨重彩一笔。

  

从社会影响看,人工智能的发展唤起全社会动力,从来不是出自实验室,而是应用端的重大事件。
就像之前说过的,研究室里的函数无法引起社会关注,广告效应才会让风投基金端着大把的金钱送到面前

因为有IBM的超级计算机“沃森”在美国著名知识问答节目《危险边缘》中战胜两名人类选手,自然语言处理(NLP)和人机交互才引发更多商业兴趣。


因为有DeepMind的AlphaGo先后战胜世界冠军李世石和柯杰,大众才关注到了深度神经网络、无监督学习、强化学习、蒙特卡洛树搜索。


因为有波士顿动力长期研发的四足机器人(Spot)和人形机器人(Atlas),并且开源了部分底层代码,人们才看到越来越多的科研机构和初创企业做出更新更好的产品(2025年春晚亮相的宇树科技产品)。

先行者在大洋彼岸,他们理所当然的认为创新的策源地在那里,硅谷才是最好的科创环境。
但这一次,DeepSeek领先了一步。

“国运级别产品”评价虽有些过,但这也是很多灯塔国精英难以接受的。

看看Anthropic公司CEO Dario Amodei发布的一篇颇有火药味的所谓深度分析报告。
充满了酸味与歧视,他所代表的那群人“不希望中国拥有强大的人工智能技术”,只有美国才有资格“取得支配且持久的领先地位”,必须“有效执行的出口管制”

强盗逻辑。就像我之前说过的,“怎么,你学习好还能补课就罢了,中学生还开始撕小学生的书本了。”

对DeepSeek芯片来源调查、对DeepSeek网络攻击、对DeepSeek涉隐私保护调查,有什么下三滥的招数继续使。看是谁在开放,谁在封闭。不排除某些口嫌体直,即当又立,一边使用一边喊打
这回对线,DeepSeek和Tiktok、华为不一样。

    

八、
下面,说一说我理解的DeepSeek中国式创新的本质。

1.大道求简。中国古代的道家文化有个词叫大道至简,这原本并没有写在老子的《道德经》里,是后人概括提炼出来,而与道家文化相吻合。
道家探索的“终极奥义”,追求简单朴素的表达,不要绕弯,不要复杂,这是探索的出发点。

当堆硬件、垒资源的边际效益已经出现递减现象,DeepSeek没有理由、也不愿意跟从模仿复制已有方法。于是它改架构,做优化,创造更加精简高效的模型生成范式

当其他大模型创业公司抓住时间窗口把技术落到产品时,DeepSeek不参与融资,不设商业运营,不做产品变现,坚持做基础模型和前沿创新。

保持技术团队结构,减低世俗欲望,求简的心态才能把最希望做的事做到更好。

一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

  

2.平衡求熵。DeepSeek追求的是平衡,不是极致。这个平衡包含算力与算法数据的平衡投入与产出的平衡时间与期望的平衡

从“两弹一星”到逐梦太空——穷则白手起家,富则节节开花。
从抗美援朝鲜到中越自卫反击——穷则战术穿插,富则火力覆盖。

早在DeepSeek发布V2模型后,就有人说它是行业的一条鲶鱼,AI界的拼多多。这只是他们按自己步调的追求平衡的选择。

面对芯片困境,DeepSeek没有选择退缩,反而激发了他们创新的潜能。
在技术竞争的高端领域,DeepSeek走平衡的特色之路,降低更多不确定性,也可能为今后的人为限制备有后手。这也为AI探索贡献了更多中国式智慧、中国式方案。

  

3.胸怀求广。从公开的DeepSeek CEO梁文锋谈话内容窥其观点:

“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”——尊重过往
“当前最重要的不是商业化,而是参与全球创新的浪潮。”——力避短视
“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”——坚持开源

DeepSeek发布每一个版本的同时,都在发论文、做开源、谈不足,甚至提建议。他们追求的是,吸引更多参力量与共建,创设一个属于中国的AI社区生态

为什么需要AI社区生态?因为有了足够广阔充实的技术社区生态,加以中国本不缺乏的丰富产业应用场景,这片土地才可能看到下一代的技术趋势,而不是未战先自怯、且战且圈钱,或是乱战盲跟从

  

4.机制求变。什么样的团队,什么样的工作机制,才能造就这样的DeepSeek。

梁文锋自己说,他们并没有什么高深莫测的奇才,都是一些Top高校的应届生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

DeepSeek的运作体系并不拘泥于传统的管理模式。团队成员可以灵活调用训练集群的资源,而不必经过繁琐的审批过程。

DeepSeek在V2和V3时,创新运用了使用多头潜在注意力(MLA)技术,这个突发奇想的设计来自团队的一员,DeepSeek立刻围绕他成立一个小组,上人上卡上资源。

梁文锋说,在不确定的前沿探索上,DeepSeek是自上而上,不前置分工而是自然分工,看到潜力时再自上而上去调配资源。
这种自由的探索精神,充分体现了创新组织的特质。

不客气的说,大厂和编内机构有多少弊病,掰着指头数不过来。
层级复杂,审批繁琐,内耗严重,方向多变,形式主义,摸鱼躺平……
AI竞速上如果沾染这些,空有一身抱负也无杀贼之力。DeepSeek给同行打了样,让更多强热爱驱动的人迸发才智。


九、
未来。
2025年的第一个月,继DeepSeek后的短短几天,抖音发布豆包1.5 Pro,阿里巴巴发布Qwen 2.5-Max,OpenAI发布GPT-o3系列。
竞速仍在继续,创新永无止尽。

大语言模型如此执着的比拼,是不是通向通用人工智能(AGI)的未来?
当算力算法数据的边际效益,递减到费大力卷出一个远不及期望的低级智能体时,会不会再次迎来AI寒冬?
无数的未知只能留给赛道上的优秀选手。

当下,中国在AI赛道上与美国差距仍大,幅度缩小。需要更多DeepSeek式勇者破浪前行。
势在我,时未及,以势待时。

面对美国政府对华制裁和Anthropic公司CEO Dario Amodei挑衅,
希望有一天,能听到类似杨洁篪2021年在安克雷奇对话时的发言:

“你们没有资格在中国的面前说,你们从实力的地位出发同中国谈话。”

    

  (全文完)

码字结束,喜欢的点个赞

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值