2024年中盘点：AI大模型在各行业的落地实践进展

最新推荐文章于 2024-09-14 16:22:37 发布

发菜君

最新推荐文章于 2024-09-14 16:22:37 发布

阅读量1.1k

点赞数 14

文章标签：人工智能大模型大模型学习 AI大模型大模型教程大模型入门

本文链接：https://blog.csdn.net/2401_84494441/article/details/141759270

版权

转眼之间，2024 年已经过半，AI 大模型的热度从去年的技术探索转向落地实践，肉眼可见的是，各行各业都纷纷在这场热潮中寻找新的业务创新点和行业增长点。

“大模型的出现带来了变革，它实现了知识平权，为我们提供了技术条件，使得我们能够参与到 AI 的应用中来。”宁德核电人工智能实验室负责人王澍在 InfoQ 17 周年庆直播中表示，核电由于行业特殊性，从业人员自身的技术意识和能力有限，加上传统 AI 依赖于规则驱动，知识门槛高，使得过去核电领域对 AI 的应用并不广泛。而大模型的出现，让过去看似不可能的事情变为了可能。

此外，即便是在物流、金融等这些已经较为普遍应用了 AI 技术等行业，大模型也带来了新的突破。顺丰科技运筹优化算法专家王一帆指出，在复杂的供应链领域，传统技术面临两大挑战，一是求解性能，二是使用门槛。对此，大模型解决了很多以前难以解决的瓶颈问题，使得业务效率大大提升。

蚂蚁集团投研支小助技术负责人纪韩以知识图谱技术的演进为例，介绍了大模型在金融领域的应用价值。他表示，随着市场的变化，管理知识图谱的成本越来越高，而且事件与金融资产波动的逻辑也在内生变化，这使得模型和知识图谱难以跟上变化节奏。对此，大模型提供了另一种可能性，由于具备阅读大量报告的能力，它能够发现报告中金融逻辑的共性，使得机器进行复杂分析变得更加可行。

然而，在面对不同行业时，大模型的落地过程仍然充满挑战。比如，成本投入是否合理、可能带来哪些新的风险、如何克服内外部的各种阻力等等。在直播对话中，三位老师展开了深入的探讨和分享。

在 8 月 16-17 日举办的 FCon 全球金融科技大会上，蚂蚁集团投研支小助技术负责人纪韩还将分享更多有关多智能体协同范式在金融产业中应用的话题，深入探讨多智能体协同范式在金融产业中的技术应用并分享经产业验证的优秀真实案例。大会更多演讲议题火热招募中，点击链接可查看目前的专题安排并提交议题：https://fcon.infoq.cn/2024/shanghai/

以下内容根据对话整理，篇幅有删减：

大模型技术的应用落地现状

InfoQ：几个月前，宁德核电推出了自主训练的核工业大模型，王老师可以介绍一下几个月来的应用进展吗？

王澍：自从我们几个月前发布了大模型，它已经展现出了多方面的发展潜力。作为我们的知识管理平台，大模型在持续迭代中显著提升了其泛化能力，效果显著。此外，基于大模型开发的首款应用“AI 讲师”已经在一些试点课程中推广使用。

在生产领域，我们设备管理等方面也推出了一些试点产品。同时，我们在 AI 人才培养方面也取得了进展，不仅培养了复合型人才，还大胆推进了种子教育计划。核电领域由于计算机背景相对薄弱，我们需要培养既能使用大模型又能训练大模型的人才。这一过程不能完全依赖第三方，必须培养自己的教员，以便为不同层次的一线员工提供相应的培训。换句话说，全员都需要掌握不同程度的技能，以适应我们行业的特殊需求。

此外，我们的大模型本身也实现了拟人化，作为宁德核电人工智能实验室的 AI 智囊，参与了日常的头脑风暴、培训学习和科研项目研讨等工作。

InfoQ：金融行业因为具有高度的复杂性、动态性和不确定性，一直是 A 及其相关技术的应用热点。请问纪老师，目前蚂蚁集团在大模型层面进行了哪些探素？有哪些典型的实践案例？

纪韩：我的工作主要集中在利用大模型及其多智能体系来解决投资研究中的问题。投资研究主要分为定量和定性两个方向。在定量研究方面，我们已经有多年的利用技术刻画金融市场的经验，并且量化金融领域已经形成了成熟的处理方式。引入大模型后，我们采用了一种更为成熟的技术，即利用大模型生成代码，这使得那些不擅长编程的分析师也能通过大模型进行初级的定量分析。

在定性研究方面，金融分析师需要进行大量的案头工作，如阅读新闻资料、研报、财报和上市公司公告等。大模型在这方面表现出了其优势，擅长处理文字材料。基于此，我们开发了一个名为“投研支小助”的智能助手工具，旨在辅助分析师的日常工作。目前，蚂蚁集团及其紧密合作伙伴已经开始内测这一工具，用以辅助理财师和分析师，帮助他们解决过去机器难以解决的问题。

InfoQ：大模型产出的内容，目前在咱们内部的应用率和采纳率如何，准确性大概处于什么水平呢？

纪韩：可以肯定的是，大模型技术的应用在两个主要方面取得了显著成效。

首先，对于理财师而言，过去他们能够服务的客户数量是有限的，因为他们需要为每位客户准备个性化的服务材料，包括投资分析报告和持仓分析等。但通过机器辅助，理财师的服务半径得以显著扩大，可以覆盖更多的客户，实现了服务能力数量级的提升。

其次，以支付宝的理财服务为例，过去在没有大模型技术支持的情况下，我们每天只能挑选有限的重点事件、新闻或政策进行解读，数量通常在 30-50 篇之间，甚至更多时候只有个位数。深入应用大模型技术后，我们可以对细分行业领域进行更细致的分析和解读，覆盖全市场的行业，数量可以达到 100-200 以上。目前，我们每天都由机器先生产一大批相关的分析和解读，然后由人工专家进行审核和改写。这使得分析报告从过去的几十篇甚至个位数，提升到了上百篇，实现了数量级的增长。

InfoQ：请问一帆老师，多年来，顺丰一直在基于智能算法优化物流供应链，那么结合大模型我们最近有哪些新的应用或实践吗？

王一帆：顺丰作为物流行业的重要企业，一直致力于解决物流和供应链中的优化问题，包括库存优化、销量预测、物流配送和路径规划等全链路供应链场景。我们不仅采用了传统的运筹学方法，也积极运用人工智能技术。随着大模型技术的兴起，顺丰投入了大量资源进行研发，利用我们在供应链领域的丰富项目经验和行业积累，发挥了天然优势。目前，顺丰在两个主要领域进行了深入研究。

供应链分析领域：传统的对话式机器人需要用户提出非常具体的问题才能给出准确的回答。借助大模型技术，用户可以用更宽泛的问题提问，大模型能够对这些问题进行细致筛选，提取出精准信息，再传递给传统的 AI 问答工具。这样，工具可以针对解析出的信息进行深入分析，提供全局性的供应链分析建议或咨询方案。

供应链决策领域：在装箱问题、库存优化和路径规划等方面，传统技术可能会遇到性能或定制化的问题。大语言模型最初用于解决词汇层面的对话生成，例如提供句子的后续词汇提示。尽管这看似与路径规划无关，但实际上，路径规划中的访问次序优化与词汇生成的顺序逻辑在数理上具有相关性。顺丰借鉴了这方面的知识，将其应用于路径规划，取得了良好效果。

传统 AI 技术的瓶颈与挑战

InfoQ：在与众多企业的交流中，我们发现虽然生成式 AI 或大模型技术被认为具有巨大的想象力和潜力，但企业在实际投入时往往持谨慎态度，会深思熟虑技术实力和成本问题。因此，大家普遍希望对比了解，在传统 AI 技术的基础上，大模型或生成式 AI 技术能够解决哪些传统技术无法解决的问题，或者在哪些方面能够带来更好的效果？

王澍：在大模型技术兴起之前，我们核电领域对 AI 的应用并不广泛，主要集中在一些特定领域的探索，如 AR 眼镜和机器狗等。这其中主要有两个原因：首先是能力层面或意识层面的问题。由于 AI 本身具有较高的知识门槛，而核电人员往往缺乏计算机背景，因此很难具备应用 AI 的意识和能力。大模型的出现带来了变革，它实现了知识平权，为我们提供了技术条件，使得我们能够参与到 AI 的应用中来。

第二个方面是业务层面的差异。传统 AI 更多依赖于规则驱动，但核电领域的复杂性使得我们这些 IT 领域的门外汉难以轻松找到并应用这些规则。大模型的端到端目标驱动方式和自然语言交流机制，使得我们即使没有深厚的 IT 背景，也能够将看似不可能的事情变为可能。

王一帆：在使用大模型技术之前，我们在行业内遇到了一些难以解决的瓶颈问题。这些问题通常涉及复杂的供应链领域，我们面临的第一个挑战是求解性能。举个例子，对于某类型的优化问题，传统技术能够在一天内求解 100 个案例，并且每个案例的得分都能达到 90 分以上，但如果没有硬件或软件的提升，就很难突破现有瓶颈，高效率的求解更多案例。大模型技术的出现改变了这一局面。现在我们可以在一天内解决一千一万甚至更多案例。虽然目前大模型可能还无法完全达到传统方法 90 分以上的平均水平，但其潜力巨大。

另一方面，使用门槛也有所降低。以往，解决这些问题需要算法人员或技术专家设计特定方法。有了成熟的大模型平台后，只需按照规定格式进行数据标注和投喂，大模型就能根据现有数据不断训练和迭代，成为一个高度智能的工具。面对新的应用场景，大模型能够快速得出良好结果，而使用这种技术不再依赖于专业的算法能力，只需在数据层面和操作层面进行一些培训即可，这大大降低了使用门槛。

纪韩：在金融领域，主观研究一直带有一种神秘性，业界一直在尝试用机器来解决主观决策的问题。例如，早期的 Alphasense 公司就利用自然语言处理技术来理解新闻，并从中提取与金融领域相关的事件和观点。还有一家在金融界广为人知的公司 Kensho，它利用知识图谱技术，将资产的涨跌和行业事件联系起来，实现金融推理。这些公司在大约 10 年前取得了一些技术成果。

随着市场的变化，管理知识图谱的成本越来越高，而且事件与金融资产波动的逻辑也在内生变化，这些模型和知识图谱很难跟上世界的变化。从那时起，大约从 2013 年到 2023 年，在这 10 年间，通过机器进行决策的尝试相对沉寂。直到大模型技术的爆发，金融界才重新发现了一种新的可能。现在，我们可能不再需要像过去那样，费尽心思地从分析师的大脑中提取他们的分析方法论和模式，通过知识工程的方式将其沉淀下来。

大模型只需要大量的金融语料，比如分析师撰写的报告，就能从中抽象出分析师自身的分析逻辑。由于大模型具备阅读大量报告的能力，它能够发现报告中金融逻辑的共性。这种能力在过去，对于整个金融界来说，几乎是不可能通过机器实现的负责分析逻辑。大模型的出现，为金融领域带来了一种全新的可能性，使得机器进行复杂分析变得更加可行。

在这里插入图片描述