全球AI大模型将往何处去？国产大模型逆袭之路，自主可控为大势所趋-CSDN博客

本文链接：https://blog.csdn.net/2401_85325726/article/details/140555753

**全球AI大模型将往何处去？**国产大模型逆袭之路，自主可控为大势所趋

全球大模型将往何处去？

大模型头部格局基本确定， AI Agent 将加速 AGI 进程

海外闭源大模型已经形成 OpenAI 为首， Google、 Anthropic 等紧随的格局。在头部闭源模型之下， Meta 引领开源模型生态，开源闭源模型差距逐步缩小。为了适配端侧需求，小参数模型也在快速发展。国内看，模型百花齐放，但技术辨识度不高， 23 年头部互联网厂商和科技企业进展较快， 24 年以来初创公司开始发力长文本、 MoE 等领域。展望后续， Scaling Law+Transformer 仍将长期有效，合成数据或逐渐成为关键数据来源。此外， AI Agent 能够极大提高现有模型的表现，是实现 AGI 的重要推力。大模型技术是 AI 浪潮的软件“基础设施”，建议持续关注相关进展。

多模态**+长文本+MoE** 已成共识， 大模型与小模型路线并驾齐驱

头部 GPT、 Gemini、 Claude 模型先后支持了多模态推理； Claude 较早实现了 200K 长文本， Gemini 将长文本推到 2M tokens； GPT-4、 Mistral 展现了 MoE 架构的优势， Gemini 也在短期内更改为 MoE 架构。共识已经形成，国内大模型厂商均在跟进， Kimi 引领长文本趋势， MiniMax、阶跃星辰较早实践 MoE 模型。 Mistral、微软、 Meta、 Google 的小模型性能不断突破，为端侧 AI 打下良好基础，成为与大模型并驾齐驱的另一条重要发展路线。

Scaling Law****未达边界， 算力换智能仍然成立

OpenAI 在 Scaling Law 论文中，从理论上预测了边界递减的存在。但实际上， OpenAI、 Google 和 Anthropic 仍在践行大参数等于高智能的路线。清华唐杰教授在 24 年 2 月北京人工智能产业创新发展大会上指出， Scaling Law 尽头远未到来，算力换智能继续成立。在参数持续变大的情况下，训练数据的需求量进一步提升，据 Epoch 预测， 2030 年到 2050 年，将耗尽低质量语言数据的库存，未来训练数据的缺乏将可能减缓机器学习模型的规模扩展。因此，合成数据或成为关键。

AI Agent 是 AGI 的关键范式，具身智能是大模型重要落地场景

AI Agent 能够自主、全流程、多步骤的执行任务，大幅延展了大模型的能力范围，被认为是实现 AGI 的关键范式。斯坦福大学吴恩达教授在 24 年 3 月的红杉美国 AI 峰会上指出，如果用户围绕 GPT-3.5 使用一个 Agent 工作流程，其实际表现甚至好于 GPT-4。并且 AI Agent 的能力能够充分受益于大模型的演进。此外，大模型与机器人具身智能的结合（如 OpenAI 与 Figure），也有望随着模型能力的迭代快速发展。24 年 AI Agent 和具身智能将成为新一代大模型的重要落地场景。

GPT-5 有望推动全球算力和应用的下一阶段发展

预期 GPT-5： 1） MoE 架构将延续，专家参数和数量或变大； 2） GPT-5及之后模型的训练数据集质量更高、规模更大； 3）在思维链 CoT 的基础上，再加一层 AI 监督； 4）支持更多外部工具调用的端到端模型； 5）多种大小不同的参数，不排除推出端侧小模型； 6）从普通操作系统到 LLM 操作系统； 7）端侧 AI Agent 将更加实用和智能。 GPT-5 的发布有望推动全球算力和应用的下一阶段发展。

OpenAI 一周内连续收购两家初创公司，布局 B 端业务

在一周时间内，OpenAI 连续进行了两次重要的收购。当地时间 6 月 21 日， OpenAI 宣布其收购了实时分析数据库公司 Rockset。该公司由 Facebook 的工程师创立，能够实现毫秒级的数据处理延迟。OpenAI 发言人称， OpenAI 之前也进行过收购，即主要为了人才而收购一家公司，但此次交易标志着 OpenAI将首次整合其收购的初创公司的技术和员工。

6 月 24 日，OpenAI 又宣布收购了屏幕共享和协作初创公司 Multi（前身为

Remotion），这是一家提供企业级视频优先协作平台的公司。Multi 提供的功

能包括满足最多 10 人通过屏幕共享进行协作、自定义快捷方式以及代码、设计

以及文档的自动链接，其技术与 OpenAI 增强 ChatGPT 桌面体验的计划相契合。

对于 Rockset 以及远程协作平台 Multi 的这两笔收购，也显示出了 OpenAI 今年以来重视 B 端业务的倾向。上个月，OpenAI 与普华永道签署合作，由后者代销其工具，包括面向企业的定制 AI 模型优化与咨询计划。目前，ChatGPT 企业用户已接近 60 万，其中包括 93%的财富 500 强企业。

国产大模型逆袭之路

海外大模型龙头轮番抢占性能第一宝座，比拼整体性能和多模态交互。

**大模型的宝座三次更迭：**初代GPT-4o自我革命，持续刷新综合性能；二代谷歌Gemini更极限的上下文理解、更低延时；翘楚Claude3.5聚焦视觉和交互体验。
**大模型高地争夺：**多模态的理解和响应，原生多模态技术比拼。大模型的效果取决于多模态理解与生成，毫秒级响应，更先进的视觉与音频理解能力，智能感知语气与语态。端到端原生多模态技术、统一神经网络，是竞争的主要角力点。
**大模型的比较维度升级：**从模型到叠加终端，跨设备的使用效果体验。如谷歌推出AI Agent项目Astra模型，可以手机、眼睛镜头对准身边的物品，并向Project Astra提出一些疑问，它几乎能做到零延时地准确回答。

国内大模型逆袭之路：聚焦长文本，降价迭代提升竞争力。

**先文后理：**理科目前差距较大，聚焦长文本，国产大模型已有赶超GPT之势，如通义千问、 KIMI、山海等。
**长文本的三大难度：**注意力机制计算复杂度、上下文记忆、最长文本约束难题。
**商业上降价，加速迭代卷出未来。**头部智谱/字节跳动/阿里/腾讯/百度/讯飞低价迭代，百川智能/月之暗面/零一万物等初创公司并未加入降价行列。从技术来看，降价的背后是训练&推理成本的下降。

自主可控为大势所趋

OpenAI在周二（6 月 25 日）凌晨明确，将从 7 月 9日起停止其不支持的国家和地区的 API 使用，中国在禁用之列。AI 自主可控为大势所趋：

**AI****算力：**目前的 AI 产业阶段还处于“ Scaling Law” （规模定律）的范畴之内，即参数越大，数据越多，模型效果越好，算力作为各家 AI大模型厂商军备竞赛的核心，仍将是确定性较高的方向。 AI 算力产业链：海光信息、寒武纪、浪潮信息、紫光股份、中科曙光、润泽科技、曙光数创等。
AI****应用： 国产 AI 大模型正在加紧追赶海外的步伐，根据上海 AI 实验室CompassRank大模型评测榜单，字节豆包、阿里通义千问等模型在测评分数上已经接近海外领先模型GPT-4Turbo和GPT-4o，叠加 OpenAI 可能禁止中国区 API 调用的影响，国产大模型及 AI 应用爆发为大势所趋。

华为发布 Harmony OS NEXT，盘古大模型 5.0 赋能千行百业。

北京时间 6月 21 日，华为正式发布 HarmonyOS NEXT，盘古大模型 5.0。本次发布HarmonyOS NEXT 具备全场景、原生智能、原生安全三大优势，正式面向开发者和先锋用户开启Beta 测试，将于今年第四季度正式投入商用。盘古大模型5.0 已在30 多个行业、 400 多个场景中落地，在全系列、多模态、强思维三个方面进行全面升级以更好赋能行业应用。我们认为，中国市场鸿蒙首次超越苹果 iOS，鸿蒙生态逐渐走向成熟，打大模型下沉OS 打造原生底层智能底座，标志着 AI 大模型与 OS 深度融合新时代开启，鸿蒙生态将打开万亿蓝海市场空间。盘古大模型5.0 将多模态与强思维能力结合，强大理解物理世界能力拓宽行业应用场景，同时推出四种规格模型以适用多场景，将在制造业、自动驾驶、工业设计、政务、金融、矿山、气象等领域发挥巨大价值。

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型？

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享

①智能客服：某科技公司员工在学习了大模型课程后，成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率，还显著降低了人工成本。
②医疗影像分析：一位医学研究人员通过学习大模型课程，掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变，为医生提供了有力的诊断辅助。
③金融风险管理：一位金融分析师利用大模型课程中学到的知识，开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险，降低了不良贷款率。
④智能推荐系统：一位电商平台的工程师在学习大模型课程后，优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率，为公司带来了显著的增长。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。