DeepSeek爆火100天：大厂重拾初心，引领AI技术新潮流！

最新推荐文章于 2025-06-05 23:40:33 发布

AI大模型-大飞

最新推荐文章于 2025-06-05 23:40:33 发布

阅读量869

点赞数 21

文章标签：人工智能 DeepSeek Qwen3 程序员大模型 AI大模型大模型入门

本文链接：https://blog.csdn.net/m0_63171455/article/details/147954561

版权

编者按：自1月20日DeepSeek R1爆火以来，过去100天的大模型世界中，DeepSeek成了当之无愧的顶流明星。DeepSeek不仅展现了中国AI的力量，也在一定程度上影响了世界AI发展的方向。值此之际，字母榜&直面AI特推出“DeepSeek爆火100天”专题报道。

即将到来的DeepSeek R2模型，究竟会不会再给大模型行业带来一次冲击，还不好说，但可以肯定的是，DeepSeek R1问世的100天来，中国AI领域原本正常的竞争节奏已经被彻底重构了。

自1月20日DeepSeek R1发布至今，仅仅用时3个多月时间，DeepSeek就创造了业界神话，截至3月份，QuestMobile数据显示，其同名APP以超1.9亿月活成为国内用户量最大的AI原生应用。

DeepSeek用户规模的瞬间爆发，让科技大厂首次正视AI to C的可能性。腾讯、百度，开始全量接入DeepSeek。在DeepSeek流量助攻之下，腾讯元宝一度超越豆包，登顶苹果免费应用下载榜第一。

抵住接入DeepSeek诱惑的阿里和字节，则一个选择靠自研模型加码C端，并尝试对通义APP投流，一个选择更紧密联动抖音和豆包，尝试进一步做大规模效应。

不过，随着DeepSeek热潮减弱，站在100天节点回看，科技大厂的竞争态势又有了重回原点的迹象：豆包重新回到AI原生应用下载量第一的位置，元宝后继乏力，跌出前20名开外，阿里对C端的重视暂未有更大动作出炉，百度则依然坚持不投流，继续缓慢发展。

尽管C端应用下载量排名在过去100天内几易其主，但有一点是毫无疑问的，那就是一众科技大厂都成了DeepSeek现象下的最大红利受益对象，且不管它们在主力C端应用上接还是没接DeepSeek。

一方面，DeepSeek爆火，带动资本市场将目光重新投向国内科技大厂，并由此迎来一波新的价值重估机遇；另一方面，DeepSeek冲击之下，曾经的“AI六小虎”几乎再无融资进展传出（唯一例外是智谱），也让外界再次意识到这场大模型之战，已经进入到巨头游戏阶段。

犹如一面镜子的DeepSeek，不仅让外界看清了这场AI大战新阶段的比拼要素，也让科技大厂看清了各自的重心所在：字节继续做大豆包规模，阿里追求开源模型的领先地位，腾讯则显露出持续激活微信流量导流AI的新策略。

DeepSeek的意外崛起，让外界看到了AI助手跑通规模效应的可能性，没有一家大厂敢冒着丢失先发优势的风险，继续等待下去。科技大厂，第一次展开了对AI助手的全方位竞争。

这场新竞争中，腾讯成了最激进的一家。在一众自研大模型厂商中，腾讯是首家将DeepSeek接入自家C端主力产品的公司。

在此之前，一众科技大厂更多选择的是，仅在自家云服务平台上接入DeepSeek模型，供外部开发者调用，刻意避开了在C端跟自家AI助手产品打擂台的情况。

除了绑定DeepSeek流量密码之外，腾讯元宝还多管齐下，不仅得到了微信、QQ等腾讯系产品的导流，还超越豆包、Kimi们，成为新晋投流王。AppGrowing数据显示，2025年1月1日-3月13日，元宝、Kimi、豆包的投放金额分别是7.1亿元、1.5亿元、0.9亿元，变化主要发生在接入DeepSeek之后的2月份以后。

面对已经落后豆包、文小言的现状，剑走偏锋的腾讯，一手靠着外溢的DeepSeek流量，一手靠着不计成本的投流，短时间内便为元宝聚拢起了大批用户，从而成为DeepSeek流量红利的最大受益者：2月13日，作为首家在C端主力产品中接入DeepSeek R1满血版的元宝，一度趁着DeepSeek东风崛起，到3月3日，便力压DeepSeek和豆包，首度登顶国内苹果免费应用下载榜。

随后，百度也在自家C端主力应用百度APP和文小言中接入了DeepSeek。但作为第二家选择接入DeepSeek的科技大厂，百度吃到的DeepSeek红利，就远不如腾讯了。

QuestMobile数据显示，截至3月份，文小言月活用户为887万。对比去年12月份的1224万，文小言月活用户量不增反降。值得一提的是，这也跟百度坚持不投流有关。

在一众科技大厂中，只有阿里和字节抵御住了DeepSeek的红利诱惑：除了在自家B端和小众C端应用上接入DeepSeek之外，无论抖音、豆包，还是淘宝、通义以及夸克，都始终没有跟进接入DeepSeek。

这跟两家公司在AI策略的打法直接相关。在DeepSeek爆火之前，字节旗下AI助手豆包，已成为中国月活用户数最多的AI对话应用。

DeepSeek爆火之后，字节CEO梁汝波给团队下定的2025年目标，其中之一便是要求团队加强规模效应，且不是通过接入DeepSeek的方式。

为此，豆包也开始了紧急的模型功能上新之路：2月25日小范围测试自研的深度思考型推理模型，3月18日全量上线深度思考功能。

在深度思考功能上对齐DeepSeek之外，豆包还持续扩大与抖音内容生态的联动，以增强用户粘性，并作为对抗腾讯元宝+DeepSeek竞争的重要手段之一。

最新的动作是，字节扩大了抖音消息列表中植入豆包作为联系人的内测范围，引导更多抖音用户下载或使用豆包APP。

在此之前，豆包已经支持在生成答案中向用户提供抖音短视频特色内容，并在3月中旬内测了一项新功能，即在原有的对话内容下面，用户继续上滑屏幕，会出现基于用户兴趣和对话推荐的内容流，堪比在豆包内再造了一个微缩版“抖音”。

不同于字节对规模效应的优先追求，阿里则更在意模型性能的比拼，在追求AGI的长期主义之下，不在意一城一地的流量得失。

尽管根据AppGrowing数据，从2月底开始，通义千问逐渐加大广告端投入，但阿里的整体投流预算依然有限。这也能从直观的月活用户变化上略窥一二。

QuestMobile数据显示，截至3月份，通义月活用户382万。作为对比，去年12月，通义为291万，月活用户数增长幅度远不及元宝、豆包。

在近期接受“晚点对话”采访时，当被问及如何看待外界调侃阿里是大模型领域的“汪峰”时，阿里云CTO、通义实验室负责人周靖人回应道，“某一天的流量其实没那么重要。”

不管接还是不接DeepSeek，大厂都成了DeepSeek现象之下的最终大赢家。

进入2025年以来，随着AI初创公司DeepSeek爆火，在其推动下，中国科技股迎来反弹，资本市场也重新审视起科技大厂的AI价值。

年初至今，港股市场，阿里股价涨了47%，腾讯涨了19%，百度涨了3%。

暂未上市的字节，股指也重回高位。2月底，彭博社援引知情人士消息称，字节估值已经突破4000亿美元，至少三家主要投资者对该公司进行了重新评估，其中包括软银、富达投资和普信集团等。字节AI业务“豆包”的成长潜力，是投资机构愿意推高字节估值的重要因素。

科技大厂在AI新机遇下的另一重利好因素，则来自苹果AI的合作大单。

外媒The Information最新爆料中，国行版苹果AI的合作名单中，新增了阿里的身影。在此之前，这份名单中相继出现过百度、腾讯、字节的名字。

之所以苹果AI的绯闻对象，几乎清一色的大厂，就连爆火的DeepSeek都难以入围，是因为苹果对服务稳定性的要求，使得一般AI公司很难支持像苹果这样的大客户所需的人力和经验。

The Information揭秘道，苹果的目标是找到一家能够基于中国用户的个人数据，理解其请求的中国合作伙伴。值此前提下，科技大厂无疑是苹果最理想的AI合作对象。

更重要的是，DeepSeek的竞争压力之下，外界也借此看清了当下大模型竞争的资本游戏本质。

1月份，“AI六小虎”之一的零一万物正式调整策略，成为首家放弃追求AGI的大模型厂商，李开复一手组建起来的预训练人才队伍，被阿里接管。

面对DeepSeek的冲击，李开复在3月的一场采访中说道，中美两国超大模型的预训练都在逐渐寡头化，并预测中国大模型领域未来的格局将会收敛至DeepSeek、阿里巴巴、字节跳动三家。

现实也在某种程度上验证着李开复“寡头化”的论断。DeepSeek R1发布以后，整个大模型领域的更新，几乎成了大厂的独角戏，包括字节、腾讯、阿里、百度都相继发布了新模型，但AI 初创公司们却几乎不再在模型更新上较劲。

更大的压力还体现在融资上。进入2025年后，国外OpenAI、xAI和Anthropic等相继完成和即将完成数十亿、乃至百亿美元的新融资，作为对照，国内“AI六小虎”几乎再无新的融资消息传出（智谱成了唯一的例外）。

DeepSeek并没有改变大模型领域对算力需求的追逐，只不过竞争的玩家进一步收缩到了科技大厂范畴。

但大厂对DeepSeek的热情也开始消退。

激进如腾讯，也不再追求更靠前的下载排名。最新情况是，截至5月8日，中国区苹果应用商店免费APP下载排行榜上，豆包再次超越DeepSeek，位列第一，紧随其后的DeepSeek被挤到了第五的位置，腾讯元宝则滑落到了第25名。

下载量排名的更迭，足以说明一个道理：AI应用之战，DeepSeek只能救一时之急，却无法成为敲定胜局的那颗银子弹。

毕竟，在当前的免费策略之下，普通用户对大模型产品尚未产生忠诚度，用户心智被体验优劣所左右。随着各家AI应用中都相继加入深度思考功能所带来的思维链展示，用户对接入DeepSeek类产品的好奇心开始有所消退，这些因好奇而来的试用型用户，留存率往往较低。

更大的消退，出现在模型上。在接入DeepSeek的同时，科技大厂也在着手研发自有模型，开始一步步疏离DeepSeek。

甚至，有的科技大厂已经开始转过头来吐槽DeepSeek，来为自家模型站台了。近期对外演讲中，百度创始人李彦宏便点名DeepSeek，称其在能力上还不能理解和生成图片、音频、视频等多媒体内容，且幻觉率高外，使用DeepSeek更大的问题还有慢和贵，“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低，而且速度也更快。”

李彦宏之前的字节，以及之后的阿里，在其推出的新模型中，都主打性价比优势。但只靠性价比显然还不足以打开市场。

DeepSeek之所以能够出圈，除了低成本之外，其重要前提之一是模型能力有了创新，首次向外界免费展示了思维链的奇妙存在。

奥特曼在点评DeepSeek爆火现象时也认为，模型的能力并不是真正让DeepSeek获得病毒式传播的关键，关键在于DeepSeek免费开放了OpenAI隐藏起来的思维链。

但环顾当下的一众新模型产品，除了在各项数据上比肩或者赶超DeepSeek，乃至OpenAI之外，它们尚未在产品体验和功能上有创新之举。

为了追求如DeepSeek一般的创新突破，科技大厂在推出自研新模型之余，开始从组织和人才两方面的调整布局中寻求契机。

字节挖来谷歌DeepMind研究副总裁吴永辉，并在近期进一步扩大Seed部门统辖范围，同时针对大模型人才，发起Top Seed计划；阿里招揽全球顶尖AI科学家许主洪，召回前钉钉创始人陈航，并继续执行A Star和Al Clouder人才项目，推出未来三年投入3800亿元，用于建设云和AI 硬件基础设施的大手笔；腾讯发起针对AI顶级人才的 “青云计划”，并在近期成立了两个新部门：大语言模型部和多模态模型部，分别负责探索大语言模型和多模态大模型的前沿技术。

如果说过去几年的大模型混战中，科技大厂还是鼻子眉毛一把抓，现在，有了DeepSeek这个参照物，它们逐步找到了各自的主攻方向：字节继续沿着做大豆包的路径前进，阿里力保自己在开源模型领域的领先位置，腾讯则显露出依赖微信抢占AI应用入口的新势头。

不过，当前科技大厂的AI竞争节奏还面临一个新变数的冲击——DeepSeek R2。随着R2模型发布在即，它不仅对DeepSeek是一大考验，对科技大厂也是。

一、大模型风口已至：月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

二、如何学习大模型 AI ？

🔥AI取代的不是人类，而是不会用AI的人！麦肯锡最新报告显示：掌握AI工具的从业者生产效率提升47%，薪资溢价达34%！🚀

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

* 大模型 AI 能干什么？
* 大模型是怎样获得「智能」的？
* 用好 AI 的核心心法
* 大模型应用业务架构
* 大模型应用技术架构
* 代码示例：向 GPT-3.5 灌入新知识
* 提示工程的意义和核心思想
* Prompt 典型构成
* 指令调优方法论
* 思维链和思维树
* Prompt 攻击和防范
* …

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

* 为什么要做 RAG
* 搭建一个简单的 ChatPDF
* 检索的基础概念
* 什么是向量表示（Embeddings）
* 向量数据库与向量检索
* 基于向量检索的 RAG
* 搭建 RAG 系统的扩展知识
* 混合检索与 RAG-Fusion 简介
* 向量模型本地部署
* …

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

* 为什么要做 RAG
* 什么是模型
* 什么是模型训练
* 求解器 & 损失函数简介
* 小实验2：手写一个简单的神经网络并训练它
* 什么是训练/预训练/微调/轻量化微调
* Transformer结构简介
* 轻量化微调
* 实验数据集的构建
* …

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

* 硬件选型
* 带你了解全球大模型
* 使用国产大模型服务
* 搭建 OpenAI 代理
* 热身：基于阿里云 PAI 部署 Stable Diffusion
* 在本地计算机运行大模型
* 大模型的私有化部署
* 基于 vLLM 部署大模型
* 案例：如何优雅地在阿里云私有部署开源大模型
* 部署一套开源 LLM 项目
* 内容安全
* 互联网信息服务算法备案
* …

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】