一文看懂DeepSeek的中国式创新一二三（三）-CSDN博客

本文链接：https://blog.csdn.net/SE7EN_CHLOE/article/details/145416857

不用大篇幅技术词汇
不搞精神胜利和闭眼狂喷
想用客观的“人话”说一说自己理解的DeepSeek中国式创新

续更，就在写的当天，英伟达、微软布接入DeepSeek，华为上线基于昇腾云服务的DeepSeekR1/V3推理服务。一直猜测已经印证了。

七、
DeepSeek强不强、新不新、抄没抄，各有各的看法。
我说下自己对DeepSeek创新的评价：

从技术创新看，DeepSeek并没有颠覆AI技术路线。甚至在创新程度上，远未达到核弹级水平。
之前AI发展史的铺垫可以看到，那些重要成果，是具有历史意义的突破。RNN、BP、LSTM、DL……要么是技术引领方向，要么是路线理念开创。

DeepSeek最具价值的创新，在于研究过程中巧妙的设计、多种技术融合、同等强劲甚至略有领先的性能，以及体现出大幅提升的效率。

AI界的领头羊OpenAI在2024年5月推出GPT-4o，9月发布推理模型GPT-o1。
主要对手Anthropic公司2024年发布最新模型Claude 3.5 Sonnet。
2024年友商这几款产品的性能也一直在沿着平滑梯度升级。

只是DeepSeek这一轮短时间内费效比的提升幅度，比太平洋对岸友商快了太多，怎能让人不侧目。

从探索方向看，DeepSeek最为称道的是坚持算法。
大语言模型有一个叫做规模化法则（Scaling Law）也称尺度定律，被业界认为是大模型预训练第一性原理。

简单来说，就是随着模型大小、数据集大小和计算资源的增加，堆越算力和数据，获得的收益就会越大。俗称越多越牛X。
然而，随着模型规模的增大，每增加相同数量的参数或计算资源，获得的性能提升逐渐减少，这叫做边际效益递减现象。

俗称，卷不动了。

不是其它友商没有在做算法，财大气粗、兵强马壮的OpenAI、Meta、Anthropic，都是不缺资源、不缺人才的主。

像DeepSeek这么年轻又小的团队，敢于打破传统尝试算法优化，并且做的通、做的好。这才是真的长脸。退一步说，就算DeepSeek做出的V3和R1略有不及友商的最新版本，那已经是了不起的成就了。

从历史进程看，集中在语言大模型（LLM）竞赛的各个团队，很像二十年前我玩的一款MMORPG游戏——魔兽世界（WOW）。

魔兽世界游戏中，玩家组成40人（或25人）的团队进入一个大型副本空间，一步步探索地图、清理小怪，击杀一个个守着关口的BOSS。
一直以来，美国、欧洲、亚洲地区各个服务器里的优秀公会，在版本开放高级副本后，都会组织团队在竞速击杀，看谁能用最少的时间通关。

但是，人工智能这个副本，路是未知的，最终BOSS在哪里也是未知的，只有一步步的探索。
也许OpenAI的ChatGPT拿下第一个BOSS的世界首杀（FD，First Down），但其它公会也在第二、第三个BOSS上你追我赶，没有谁是次次FD。

那么今天，国服非知名公会DeepSeek，克服了刻意制造服务器延迟（芯片制裁），在极短时间内（成立不到1年半），集合一批新玩家组成团队（211TOP高校应届生等），装备等级和药品补给落后（成本显著低于友商）的前提下，世界首杀第N个BOSS。
并且DeepSeek创设新的击杀方法，击杀后公布技术文档，制作击杀视频对全球玩家开放（开源）。

未来，会有更多的美服和国服公会拿到后面BOSS的首杀。
通向AI最终BOSS可能会像迷宫一样，走其它探索击杀的不同道路。
但是，这都不妨碍DeepSeek在这一轮书写浓墨重彩一笔。

从社会影响看，人工智能的发展唤起全社会动力，从来不是出自实验室，而是应用端的重大事件。
就像之前说过的，研究室里的函数无法引起社会关注，广告效应才会让风投基金端着大把的金钱送到面前。

因为有IBM的超级计算机“沃森”在美国著名知识问答节目《危险边缘》中战胜两名人类选手，自然语言处理（NLP）和人机交互才引发更多商业兴趣。

因为有DeepMind的AlphaGo先后战胜世界冠军李世石和柯杰，大众才关注到了深度神经网络、无监督学习、强化学习、蒙特卡洛树搜索。

因为有波士顿动力长期研发的四足机器人（Spot）和人形机器人（Atlas），并且开源了部分底层代码，人们才看到越来越多的科研机构和初创企业做出更新更好的产品（2025年春晚亮相的宇树科技产品）。

先行者在大洋彼岸，他们理所当然的认为创新的策源地在那里，硅谷才是最好的科创环境。
但这一次，DeepSeek领先了一步。

“国运级别产品”评价虽有些过，但这也是很多灯塔国精英难以接受的。

看看Anthropic公司CEO Dario Amodei发布的一篇颇有火药味的所谓深度分析报告。
充满了酸味与歧视，他所代表的那群人“不希望中国拥有强大的人工智能技术”，只有美国才有资格“取得支配且持久的领先地位”，必须“有效执行的出口管制”。

强盗逻辑。就像我之前说过的，“怎么，你学习好还能补课就罢了，中学生还开始撕小学生的书本了。”

对DeepSeek芯片来源调查、对DeepSeek网络攻击、对DeepSeek涉隐私保护调查，有什么下三滥的招数继续使。看是谁在开放，谁在封闭。不排除某些口嫌体直，即当又立，一边使用一边喊打。
这回对线，DeepSeek和Tiktok、华为不一样。

八、
下面，说一说我理解的DeepSeek中国式创新的本质。

1.大道求简。中国古代的道家文化有个词叫大道至简，这原本并没有写在老子的《道德经》里，是后人概括提炼出来，而与道家文化相吻合。
道家探索的“终极奥义”，追求简单朴素的表达，不要绕弯，不要复杂，这是探索的出发点。

当堆硬件、垒资源的边际效益已经出现递减现象，DeepSeek没有理由、也不愿意跟从模仿复制已有方法。于是它改架构，做优化，创造更加精简高效的模型生成范式。

当其他大模型创业公司抓住时间窗口把技术落到产品时，DeepSeek不参与融资，不设商业运营，不做产品变现，坚持做基础模型和前沿创新。

保持技术团队结构，减低世俗欲望，求简的心态才能把最希望做的事做到更好。

一个东西能不能让社会的运行效率变高，以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高，就是成立的。中间很多都是阶段性的，过度关注必然眼花缭乱。

2.平衡求熵。DeepSeek追求的是平衡，不是极致。这个平衡包含算力与算法数据的平衡，投入与产出的平衡，时间与期望的平衡。

从“两弹一星”到逐梦太空——穷则白手起家，富则节节开花。
从抗美援朝鲜到中越自卫反击——穷则战术穿插，富则火力覆盖。

早在DeepSeek发布V2模型后，就有人说它是行业的一条鲶鱼，AI界的拼多多。这只是他们按自己步调的追求平衡的选择。

面对芯片困境，DeepSeek没有选择退缩，反而激发了他们创新的潜能。
在技术竞争的高端领域，DeepSeek走平衡的特色之路，降低更多不确定性，也可能为今后的人为限制备有后手。这也为AI探索贡献了更多中国式智慧、中国式方案。

3.胸怀求广。从公开的DeepSeek CEO梁文锋谈话内容窥其观点：

“我们不过是站在开源社区巨人们的肩膀上，给国产大模型这栋大厦多拧了几颗螺丝。”——尊重过往
“当前最重要的不是商业化，而是参与全球创新的浪潮。”——力避短视
“在颠覆性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人赶超。”——坚持开源

DeepSeek发布每一个版本的同时，都在发论文、做开源、谈不足，甚至提建议。他们追求的是，吸引更多参力量与共建，创设一个属于中国的AI社区生态。

为什么需要AI社区生态？因为有了足够广阔充实的技术社区生态，加以中国本不缺乏的丰富产业应用场景，这片土地才可能看到下一代的技术趋势，而不是未战先自怯、且战且圈钱，或是乱战盲跟从。

4.机制求变。什么样的团队，什么样的工作机制，才能造就这样的DeepSeek。

梁文锋自己说，他们并没有什么高深莫测的奇才，都是一些Top高校的应届生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。

DeepSeek的运作体系并不拘泥于传统的管理模式。团队成员可以灵活调用训练集群的资源，而不必经过繁琐的审批过程。

DeepSeek在V2和V3时，创新运用了使用多头潜在注意力（MLA）技术，这个突发奇想的设计来自团队的一员，DeepSeek立刻围绕他成立一个小组，上人上卡上资源。

梁文锋说，在不确定的前沿探索上，DeepSeek是自上而上，不前置分工而是自然分工，看到潜力时再自上而上去调配资源。
这种自由的探索精神，充分体现了创新组织的特质。

不客气的说，大厂和编内机构有多少弊病，掰着指头数不过来。
层级复杂，审批繁琐，内耗严重，方向多变，形式主义，摸鱼躺平……
AI竞速上如果沾染这些，空有一身抱负也无杀贼之力。DeepSeek给同行打了样，让更多强热爱驱动的人迸发才智。

九、
未来。
2025年的第一个月，继DeepSeek后的短短几天，抖音发布豆包1.5 Pro，阿里巴巴发布Qwen 2.5-Max，OpenAI发布GPT-o3系列。
竞速仍在继续，创新永无止尽。

大语言模型如此执着的比拼，是不是通向通用人工智能（AGI）的未来？
当算力算法数据的边际效益，递减到费大力卷出一个远不及期望的低级智能体时，会不会再次迎来AI寒冬？
无数的未知只能留给赛道上的优秀选手。

当下，中国在AI赛道上与美国差距仍大，幅度缩小。需要更多DeepSeek式勇者破浪前行。
势在我，时未及，以势待时。

面对美国政府对华制裁和Anthropic公司CEO Dario Amodei挑衅，
希望有一天，能听到类似杨洁篪2021年在安克雷奇对话时的发言：

“你们没有资格在中国的面前说，你们从实力的地位出发同中国谈话。”

（全文完）

码字结束，喜欢的点个赞