2024年中盘点:AI大模型在各行业的落地实践进展

转眼之间,2024 年已经过半,AI 大模型的热度从去年的技术探索转向落地实践,肉眼可见的是,各行各业都纷纷在这场热潮中寻找新的业务创新点和行业增长点。

“大模型的出现带来了变革,它实现了知识平权,为我们提供了技术条件,使得我们能够参与到 AI 的应用中来。”宁德核电人工智能实验室负责人王澍在 InfoQ 17 周年庆直播中表示,核电由于行业特殊性,从业人员自身的技术意识和能力有限,加上传统 AI 依赖于规则驱动,知识门槛高,使得过去核电领域对 AI 的应用并不广泛。而大模型的出现,让过去看似不可能的事情变为了可能。

此外,即便是在物流、金融等这些已经较为普遍应用了 AI 技术等行业,大模型也带来了新的突破。顺丰科技运筹优化算法专家王一帆指出,在复杂的供应链领域,传统技术面临两大挑战,一是求解性能,二是使用门槛。对此,大模型解决了很多以前难以解决的瓶颈问题,使得业务效率大大提升。

蚂蚁集团投研支小助技术负责人纪韩以知识图谱技术的演进为例,介绍了大模型在金融领域的应用价值。他表示,随着市场的变化,管理知识图谱的成本越来越高,而且事件与金融资产波动的逻辑也在内生变化,这使得模型和知识图谱难以跟上变化节奏。对此,大模型提供了另一种可能性,由于具备阅读大量报告的能力,它能够发现报告中金融逻辑的共性,使得机器进行复杂分析变得更加可行。

然而,在面对不同行业时,大模型的落地过程仍然充满挑战。比如,成本投入是否合理、可能带来哪些新的风险、如何克服内外部的各种阻力等等。在直播对话中,三位老师展开了深入的探讨和分享。

在 8 月 16-17 日举办的 FCon 全球金融科技大会上,蚂蚁集团投研支小助技术负责人纪韩还将分享更多有关多智能体协同范式在金融产业中应用的话题,深入探讨多智能体协同范式在金融产业中的技术应用并分享经产业验证的优秀真实案例。大会更多演讲议题火热招募中,点击链接可查看目前的专题安排并提交议题:https://fcon.infoq.cn/2024/shanghai/

以下内容根据对话整理,篇幅有删减:

大模型技术的应用落地现状

InfoQ:几个月前,宁德核电推出了自主训练的核工业大模型,王老师可以介绍一下几个月来的应用进展吗?

王澍:自从我们几个月前发布了大模型,它已经展现出了多方面的发展潜力。作为我们的知识管理平台,大模型在持续迭代中显著提升了其泛化能力,效果显著。此外,基于大模型开发的首款应用“AI 讲师”已经在一些试点课程中推广使用。

在生产领域,我们设备管理等方面也推出了一些试点产品。同时,我们在 AI 人才培养方面也取得了进展,不仅培养了复合型人才,还大胆推进了种子教育计划。核电领域由于计算机背景相对薄弱,我们需要培养既能使用大模型又能训练大模型的人才。这一过程不能完全依赖第三方,必须培养自己的教员,以便为不同层次的一线员工提供相应的培训。换句话说,全员都需要掌握不同程度的技能,以适应我们行业的特殊需求。

此外,我们的大模型本身也实现了拟人化,作为宁德核电人工智能实验室的 AI 智囊,参与了日常的头脑风暴、培训学习和科研项目研讨等工作。

InfoQ:金融行业因为具有高度的复杂性、动态性和不确定性,一直是 A 及其相关技术的应用热点。请问纪老师,目前蚂蚁集团在大模型层面进行了哪些探素?有哪些典型的实践案例?

纪韩:我的工作主要集中在利用大模型及其多智能体系来解决投资研究中的问题。投资研究主要分为定量和定性两个方向。在定量研究方面,我们已经有多年的利用技术刻画金融市场的经验,并且量化金融领域已经形成了成熟的处理方式。引入大模型后,我们采用了一种更为成熟的技术,即利用大模型生成代码,这使得那些不擅长编程的分析师也能通过大模型进行初级的定量分析。

在定性研究方面,金融分析师需要进行大量的案头工作,如阅读新闻资料、研报、财报和上市公司公告等。大模型在这方面表现出了其优势,擅长处理文字材料。基于此,我们开发了一个名为“投研支小助”的智能助手工具,旨在辅助分析师的日常工作。目前,蚂蚁集团及其紧密合作伙伴已经开始内测这一工具,用以辅助理财师和分析师,帮助他们解决过去机器难以解决的问题。

InfoQ:大模型产出的内容,目前在咱们内部的应用率和采纳率如何,准确性大概处于什么水平呢?

纪韩:可以肯定的是,大模型技术的应用在两个主要方面取得了显著成效。

首先,对于理财师而言,过去他们能够服务的客户数量是有限的,因为他们需要为每位客户准备个性化的服务材料,包括投资分析报告和持仓分析等。但通过机器辅助,理财师的服务半径得以显著扩大,可以覆盖更多的客户,实现了服务能力数量级的提升。

其次,以支付宝的理财服务为例,过去在没有大模型技术支持的情况下,我们每天只能挑选有限的重点事件、新闻或政策进行解读,数量通常在 30-50 篇之间,甚至更多时候只有个位数。深入应用大模型技术后,我们可以对细分行业领域进行更细致的分析和解读,覆盖全市场的行业,数量可以达到 100-200 以上。目前,我们每天都由机器先生产一大批相关的分析和解读,然后由人工专家进行审核和改写。这使得分析报告从过去的几十篇甚至个位数,提升到了上百篇,实现了数量级的增长。

InfoQ:请问一帆老师,多年来,顺丰一直在基于智能算法优化物流供应链,那么结合大模型我们最近有哪些新的应用或实践吗?

王一帆:顺丰作为物流行业的重要企业,一直致力于解决物流和供应链中的优化问题,包括库存优化、销量预测、物流配送和路径规划等全链路供应链场景。我们不仅采用了传统的运筹学方法,也积极运用人工智能技术。随着大模型技术的兴起,顺丰投入了大量资源进行研发,利用我们在供应链领域的丰富项目经验和行业积累,发挥了天然优势。目前,顺丰在两个主要领域进行了深入研究。

供应链分析领域:传统的对话式机器人需要用户提出非常具体的问题才能给出准确的回答。借助大模型技术,用户可以用更宽泛的问题提问,大模型能够对这些问题进行细致筛选,提取出精准信息,再传递给传统的 AI 问答工具。这样,工具可以针对解析出的信息进行深入分析,提供全局性的供应链分析建议或咨询方案。

供应链决策领域:在装箱问题、库存优化和路径规划等方面,传统技术可能会遇到性能或定制化的问题。大语言模型最初用于解决词汇层面的对话生成,例如提供句子的后续词汇提示。尽管这看似与路径规划无关,但实际上,路径规划中的访问次序优化与词汇生成的顺序逻辑在数理上具有相关性。顺丰借鉴了这方面的知识,将其应用于路径规划,取得了良好效果。

传统 AI 技术的瓶颈与挑战

InfoQ:在与众多企业的交流中,我们发现虽然生成式 AI 或大模型技术被认为具有巨大的想象力和潜力,但企业在实际投入时往往持谨慎态度,会深思熟虑技术实力和成本问题。因此,大家普遍希望对比了解,在传统 AI 技术的基础上,大模型或生成式 AI 技术能够解决哪些传统技术无法解决的问题,或者在哪些方面能够带来更好的效果?

王澍:在大模型技术兴起之前,我们核电领域对 AI 的应用并不广泛,主要集中在一些特定领域的探索,如 AR 眼镜和机器狗等。这其中主要有两个原因:首先是能力层面或意识层面的问题。由于 AI 本身具有较高的知识门槛,而核电人员往往缺乏计算机背景,因此很难具备应用 AI 的意识和能力。大模型的出现带来了变革,它实现了知识平权,为我们提供了技术条件,使得我们能够参与到 AI 的应用中来。

第二个方面是业务层面的差异。传统 AI 更多依赖于规则驱动,但核电领域的复杂性使得我们这些 IT 领域的门外汉难以轻松找到并应用这些规则。大模型的端到端目标驱动方式和自然语言交流机制,使得我们即使没有深厚的 IT 背景,也能够将看似不可能的事情变为可能。

王一帆:在使用大模型技术之前,我们在行业内遇到了一些难以解决的瓶颈问题。这些问题通常涉及复杂的供应链领域,我们面临的第一个挑战是求解性能。举个例子,对于某类型的优化问题,传统技术能够在一天内求解 100 个案例,并且每个案例的得分都能达到 90 分以上,但如果没有硬件或软件的提升,就很难突破现有瓶颈,高效率的求解更多案例。大模型技术的出现改变了这一局面。现在我们可以在一天内解决一千一万甚至更多案例。虽然目前大模型可能还无法完全达到传统方法 90 分以上的平均水平,但其潜力巨大。

另一方面,使用门槛也有所降低。以往,解决这些问题需要算法人员或技术专家设计特定方法。有了成熟的大模型平台后,只需按照规定格式进行数据标注和投喂,大模型就能根据现有数据不断训练和迭代,成为一个高度智能的工具。面对新的应用场景,大模型能够快速得出良好结果,而使用这种技术不再依赖于专业的算法能力,只需在数据层面和操作层面进行一些培训即可,这大大降低了使用门槛。

纪韩:在金融领域,主观研究一直带有一种神秘性,业界一直在尝试用机器来解决主观决策的问题。例如,早期的 Alphasense 公司就利用自然语言处理技术来理解新闻,并从中提取与金融领域相关的事件和观点。还有一家在金融界广为人知的公司 Kensho,它利用知识图谱技术,将资产的涨跌和行业事件联系起来,实现金融推理。这些公司在大约 10 年前取得了一些技术成果。

随着市场的变化,管理知识图谱的成本越来越高,而且事件与金融资产波动的逻辑也在内生变化,这些模型和知识图谱很难跟上世界的变化。从那时起,大约从 2013 年到 2023 年,在这 10 年间,通过机器进行决策的尝试相对沉寂。直到大模型技术的爆发,金融界才重新发现了一种新的可能。现在,我们可能不再需要像过去那样,费尽心思地从分析师的大脑中提取他们的分析方法论和模式,通过知识工程的方式将其沉淀下来。

大模型只需要大量的金融语料,比如分析师撰写的报告,就能从中抽象出分析师自身的分析逻辑。由于大模型具备阅读大量报告的能力,它能够发现报告中金融逻辑的共性。这种能力在过去,对于整个金融界来说,几乎是不可能通过机器实现的负责分析逻辑。大模型的出现,为金融领域带来了一种全新的可能性,使得机器进行复杂分析变得更加可行

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值