-
智能体主题分享:AI Agent现状、技术进展与发展趋势,附36页PPT下载
-
一份PPT了解AI Agent近期现状与发展趋势,附36页PPT下载
-
智能体行业观察:AI Agent现状、技术进展与发展趋势,附PPT下载
-
想要了解AI Agent近期行业现状与发展趋势,不要错过这份36页智能体PPT
近期的一系列研报,都预测了AI Agent(智能体)的巨大市场潜力。
Gartner预计,到2028年,至少15%的日常工作决策将通过AI Agent自主完成(2024年这一比例为0%)。届时,33%的企业软件应用程序也将包含Agentic AI。
德勤预测,到2025年,25%使用生成式AI(GenAI)的企业将部署 AI Agents,到2027 年将增长到50%。
Capgemini一份报告指出,大多数组织(82%)计划到 2026 年集成 AI Agent。这主要用于电子邮件生成、编码和数据分析等任务。
对于中国市场,IDC预测,到2026年,将有50%的中国500强数据团队使用AI Agent来实现数据准备和分析,并成为重要组织者和协调者。
这些数据,都无一例外地预测了LLM Based Agent这一新兴技术的锦绣前程。随着2025年AI Agent商用元年的开启,我们还将看到专门从事金融(自动交易机器人)、零售(个性化购物助手)和医疗保健(虚拟健康顾问)等领域的AI Agent产品及实际应用。
事实上,2024年下半年开始一些企业已经在应用智能体,并且有的量级已经不小。
比如到在11月份,京东云已经有7000多个智能体,微软更是已经有10万企业客户在使用智能体。在一些公司,一个员工与10个以上的智能体协作的情况并不少见。在C端,使用智能体进行内容创作、资料搜集、文档处理等的应用案例更是层出不穷。
随着智能体、AI Agent等概念被更多人所熟知,整个Agent市场都热了起来。除了一级市场的更多Agent项目获得融资,二级市场也对于智能体相关概念股也开始火热。
而当前AI Agent应用发展最劲爆的领域当属web 3领域的AI Agent代币,比如ACT、GOAT等项目可谓盛况空前。
AI Agent的逐步应用和普及,正在改变企业运营模式、改善客户体验,为决策支持和自动化服务带来革命性变化。同时智能体在二级市场、币圈的火爆以及更多领域的应用,也让更多人想要迫切了解AI Agent的现状以及发展趋势。
12月31日,王吉伟频道受「机械工业出版社」和「全球数据资产理事会」邀请在跨年夜活动上做了一个名为《AI Agent现状与发展趋势》的主题分享。
这个分享主要介绍了AI Agent的现状、技术进展、应用现状、问题与不足以及几个未来发展趋势,通过一些实例和数据展示了AI Agent在不同行业的应用情况,分析了其面临的挑战和未来的发展方向。
今天王吉伟频道分享的主题是《AI Agent的现状与发展趋势》,分为三个部分:
第一部分:AI Agent的现状;
第二部分:AI Agent的技术进展;
第三部分:AI Agent的发展趋势。
第一部分:AI Agent的现状
虽然现在聊智能体的已经很多,在开始谈论这个行业之前,我们仍有必要先了解一下AI Agent。
1、AI Agent的定义与框架
在2023年3月,AutoGPT横空出世,那时人们开始接触AI Agent,但对其并不了解。7月份,OpenAI的翁丽莲发表了一篇名为《LLM Powered Autonomous AI Agents》的博文,详细介绍了基于大语言模型的AI Agent的技术架构,被认为是目前比较理想的技术架构。
该架构包括基础规划、工具使用等模块,再加上大语言模型,共四个模块,通过使用工具,最后采取行动,基本构成如下图。
关于智能体的概念,很多组织从不同角度出发,给出了很多定义。比如IBM将AI Agent定义为一个自主执行任务的系统或程序。Anthropic最近也对AI Agent下了一个简洁定义:AI Agent是大语言模型动态指导自己的流程和工具使用的系统,保持对完成任务方式的控制。
现在我们所说的AI Agent,基本都是基于大语言模型的,也就是LLM Based Agent。
目前,业界对复旦大学NLP团队提出的定义比较认可,即AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。
在此定义下,AI Agent主要分为感知、规划和行动三部分。感知后开始规划,做出决策,然后行动。行动完成后,进入观察环境的循环,继续感知,再进一步规划、优化,最后采取更好的行动,这是最简洁的AI Agent表达式。
该表达式称为PPA,即感知、规划、行动三个词的首字母组合。PPA表达式虽简单,但包含丰富内容。感知涵盖人体五觉及其他延伸感触;规划包括目标设定、信息收集、分析等;行动则涉及利用工具、合作沟通等,行动本身还可进一步拓展。
2、AI Agent的爆发原因
我们已经熟悉了AI Agent,再来看看行业的情况。接下来有一个问题需要大家思考:为什么这个时间节点智能体爆发了?
开头也说过,AutoGPT作为第一个被大家关注的LLM Agent,它出现到现在已经1年8个月了,实际时间还要长,为什么到现在AI Agent才真正火爆起来呢?
首先,我们来看两个近期的现象:
二级市场火爆。现在有大量的机构,研报机构、券商等,发布了对解读智能体的市场趋势的报告。然后二级市场涌入了很多智能体相关的概念股,一些上市公司都开始关注相关的概念,包括一些股民也开始研究相关的概念。这就导致很多人开始围绕智能体进行炒作,包括公募基金等。然后市场一起来,大家就开始更多地关注。
币圈市场疯狂。web 3 代币领域AI Agent现在特别火,10月中旬首个AI Agent代币GOAT发布后,迅速成为市场的焦点,现在很多组织都在考虑基于AI Agent技术来发行代币。GOAT与ACT两个代币在这个赛道上线后短时间内实现了惊人的价值飞跃,市场空前高涨。
币圈包括其他金融市场的很多人,都是因为这个知道了AI Agent。比如我有个混币圈的读者,就是因为Agent代币现在买了书恶补相关知识。这里有个数据,ACT代币在币安上市24小时内,涨幅超过2000%,GOAT代币市值一度突破14亿。
AI Agent在这个事件节点爆发,主要有三个原因:
原因1:商业化临界点突破实现落地商用。确实,现在很多企业开始应用并取得了不错的成效。与半年前或一年前不同,那时大家都在讨论概念和发展趋势,实际应用案例很少。
如今,包括很多个人用户也在探索和应用AI Agent。微软之前在大会上公布,已有超过十万用户在使用他们的智能体产品。京东之前也有数据,他们已经有7000多个智能体。
通过与一些创业公司交流得知,他们现在每个员工至少在用10个智能体。当然,这些智能体有的可能只是简单的问答机器人,有的能执行一些简单的文本搜索任务,但他们都算当前业内定义的智能体。
此外,豆包用户据说已突破6000万。现在,使用豆包这类智能体进行创作、数据处理的案例越来越多。用户也越来越多,用户年龄小到10来岁的小学生,大到年过五旬的大爷大妈。
原因2:真正能够解决实际问题。大语言模型不断进化,今年当中大语言模型就迭代多次。多模态、推理微化、端侧应用包括RAG等技术的不断突破,让大语言模型能力不断增强。
这些新技术、新的大语言模型技术、新的技术架构,让智能体真正能够让大模型实现从理论到实际执行任务的转变。尤其是工作流的引入,让智能体能够更强地执行更复杂的任务。
原因3:商业应用可见。Coze、文心智能体、元器、智谱清言等智能体平台上,已经有大量用户构建了很多AI Agent。
智能体平台的手机端应用,手机厂商提出的手机智能体,包括PC厂商推出的PC智能体,以及智能眼镜、智能耳机等终端设备,现在都贴着智能体应用的标签,或者本身就是一个智能体,这让很多C端用户有了更多感知,用户正在呈现指数级增长。
其中,代表性事件是11月初Anthropic(推出Cloude的公司)推出的一个能操控电脑的模型,用该模型加上一个应用程序就能直接操控电脑帮助用户做一些事情。这其实就是一个智能体应用,电脑使用(Computer Use)概念股也因此大热。
还有智谱推出的AutoGLM,当时吸引了市场投资等众多机构的关注。以前智能体只是在讨论其可能性,现在通过Cloude、AutoGLM等,大家真的能感受到这些智能体可以做一些我们想做的事情。
这三个原因叠加,足以让AI Agent火爆起来。
宏观角度来看,全球企业持续投入,使得一些领域已经初步实现了商业化,加上众多企业布局产品和生态,所以大家都在说2025年有望成为AI Agent商用元年。宏观上,AI Agent的市场爆发可以归结为以下三个主要原因:
技术进步:一些技术有效推动了AI Agent在各个领域的应用。
政策支持:全球各国对人工智能的重视,然后会出台一系列相关政策,政策出台后,AI的发展就会进一步加速。
自动化与个性化客户体验需求上升:企业通过实施AI Agent提升自动化运营效率,对个性化数字互动的需求也在增长,各种需求都在增长,最后使得智能体的采用率和渗透率不断提升。
3、大公司动态
要研究一个行业或者产业,必须要看大公司在这个领域做什么,大公司的各种动作最能彰显某项技术应用与发展的情况。
最近几个月,科技公司在AI Agent方面动作频频。事实上,从AI Agent概念出现以来,他们一直在做相关方面的探索、技术开发和运用。
国外公司:微软、Facebook、谷歌等国外技术公司,他们最近两到三个月内有不少动作。当然,我只选取了一些比较重要的放在这里,其实他们做的还更多。再看创业公司这边,OpenAI、Anthropic等都有布局。
同时,我们还能看到许多知名的国外公司,像Nvidia、苹果、IBM等都一直在潜心探索、推出和应用智能体。尤其是在B端,像Salesforce、Oracle、SAP等企业管理软件公司,他们现在在AI Agent方面的动作甚至比科技巨头公司还多,经常隔上一段时间就会发布产品和解决方案,以及公布相关数据。
国内公司:国内情况也一样。我们可以看到这里列举的公司,如阿里、腾讯、字节、百度,他们在AI Agent方面有一些动作,提出一些政策或解决方案、技术等。
大模型创业公司,如智谱AI,在AI Agent方面一直有非常密集的动作。其他大模型创企,如月之暗面等也是如此,包括产品的迭代和开发、应用市场的开拓等,重点围绕AI Agent做生态拓展。
从2024年下半年开始,大家都在讲LLM的落地应用。现在应用重点落点到AI Agent,2025年以后更是如此,大家自然要在这个落点上全速奔跑。
大模型公司对AI Agent的推广、应用以及在各领域的合作有更强的需求,所以要积极拓展应用生态,不断推出更新的产品和解决方案。现在几乎所有的大模型公司接下来都要往运用走,都在做AI Agent的事情,可以说现在的大语言模型公司都是AI Agent公司、智能体企业。
其他的大公司,像华为、美团、京东等也都有相应的动作,包括小米、荣耀、Vivo、联想等终端公司也是如此,都在重点围绕市场、生态、技术等相关布局及市场拓展。
4、行业数据
接下来看一些行业数据,这里搜集整理了五个行业的相关数据。
在医疗保健行业,AI Agent自动执行89%的临床文档任务,用于斑块检测的CT图像处理中的AI Agent达到97%的准确率。
在人力资源行业,使用智能体后,简历筛选这块可以减少75%的工作量,94%的人力资源人员认为AI Agent可以很好地改进招聘流程,6%的人力资源领导者认为它可以提供个性化学习机会,HR运营成本能节省25%。
零售行业现在采用AI Agent算是比较领先的,因为他们的数字化程度比较高,所以能够很快引入智能体技术或推出自己的解决方案,一些方面的数据也很好,可以看到零售商的运营成本能降低72%。
金融行业不用多说,它在全行业中数据化程度最高、数据最完整、结果化数据最多。所以它采用AI Agent的速度比较快、效率比较高,效果也比较好。
对于制造业来说,很难想象制造业在RPA应用方面,有的可能还在RPA 2.0阶段,有的可能刚开始使用结合AI的RPA,如果他们使用AI Agent,也能达到这些数据的呈现。
5、AI Agent全景图
随着更多AI Agent产品的解决方案推出,越来越多涉及AI Agent的公司和团队慢慢浮出水面,行业版图也逐渐清晰。
国外全景图
大家看一下这两张图,左边这张是New Economies在6月份绘制的市场地图,右边这张是投资机构Insight Partners给出的12月市场全景图。可以看到从6月到12月,AI Agent项目增加了这么多,变化还是蛮大的。半年时间便有大量的AI Agent项目出现,并且实现了产品化,可以用于企业与个人的工作与生产。
这张图中间主体是Agents部分,这些公司已经推出了AI Agent产品、解决方案或者服务,或者是在原有AI产品基础上推出的AI Agent。其他部分厂商,他们也正在向AI Agent过渡,或者已经推出了相关产品或服务,还有一些是从自动化角度切入到Agent赛道。
但不管过去的产品形态怎样,现在他们都在向Agent过渡或转型。这些企业既有科技巨头,也有企业服务及自动化领域的名宿,更有大量初创企业。所以,这张图名为AI Automation & Agents Market Map。
这里多说一句,其实从自动化角度看,包括LLM及AI Agent等在内的任何类型的AI技术带来的都是业务流程的自动化,区别只是自动化程度的高低。
我们不用过多关注技术的变革与颠覆,重要的是在每个技术变革时代善用这些技术去解决问题,那么你就能成为每个时代的弄潮儿。
国内全景图
国内的市场情况,王吉伟频道查阅了两份行业报告。左边这张图是甲子光年在4月份发布的《中国AI Agent行业研究报告》,他们根据当时的市场情况绘制了中国AI Agent生态图谱1.0版本。当然,这张图也体现了去年国内智能体行业的生态结构。
右边这张图是InfoQ发布的第二季度报告。可以看到智能体产品明显多了。从4月到6月,一些创业型产品出来了,还有一些大公司也推出了相关产品。当然这是半年前的市场情况,现在的产品要更多。
6、产品现状
当前的AI Agent产品及服务形态,大概有以下几种。其中常见AI Agent产品包括聊天助手、编码助手、AI搜索等。
当前的AI Agent产品,具备以下几个产品通性:
聊天机器人如ChatGPT、Kimi、通义千问等已发展为综合应用类AI Agent,具备工具使用和推理功能。AI搜索和编码助手是较成功的AI Agent产品,传统搜索引擎和创业项目均有相关产品推出。
C端产品主要集中在AI Agent构建平台上的用户自建产品,尚未出现大量爆款应用。众多厂商将AI Agent开发应用于B端,提供企业级解决方案,企业软件厂商也纷纷推出相关产品。
目前,B端是AI Agent红利的主要领域,因企业对安全、可信、可控智能体的需求,以及大语言模型存在的问题,使得基于软件架构集成Agent的企业级产品更受青睐。
市面上的AI Agent多基于特定知识库或数据构建,在问答交互方面表现出色,但在程序联动和操作,如直接操作ERP系统等方面存在局限。
对于6个产品通性,具体见PPT内容。
智能体构建平台
这里重点说一说智能体构建平台。
智能体构建平台,现在已经成为已经成为智能体应用构建与承载的中流砥柱。大家看到的或者体验的很多智能体基本都是通过一些智能体平台的构建的。
目前智能体平台更多的还是面向开发者,普通用户想构建适合自身需求的智能体还有一定的门槛,当然直接使用开发者们构建的智能体是没有问题的。
像coze、文心智能体、智谱清言等现在创建和使用已经很简单,能够实现一句话创建一个智能体,当然要实现多智能体、工作流等复杂的功能仍旧需要一些时间去学习、理解和应用。所以要想让更多人更简单的构建和使用智能体,还需要进一步降低这个门槛。
在AI应用构建方面,智能体构建平台初步把智能体改造成了基于LLM的低\无代码平台,低\无代码平台也正在积极融合Agent技术升级为Agent构建平台。接下来这类平台都会先向LLM低\无代码平台过渡,再慢慢进化为具备更多功能能够构建复杂智能体的平台。
总体评估:仍处于AI Agent的初级阶段
当前仍处于AI Agent的初级阶段。更多智能体更像是对话机器人,能够执行相对复杂的任务,距离终极目标自主Agent还有很大一段距离。
即便如此,它的应用趋势已经势不可挡。AI Agent在多个行业如客服、编程、内容创作等领域广泛应用,尤其在中国电商、教育等行业落地显著。
技术进步使AI Agent能自主工作,展现人类推理和创造性思维。安全性和伦理问题受到关注,多模态交互界面实现突破。AI Agent在科研等领域应用拓展,预计5-10年内将推动企业分层和应用聚焦,商业价值逐渐显现。
7、AI Agent的问题与不足
虽然AI Agent已经逐渐在很多领域实现商用,受限于现阶段的技术、生态、用户接受度等因素,仍然存在一些问题和不足。
AI产品存在的不足,这里王吉伟频道总结了9点,包括AI Agent存在交互能力局限、工程稳定性上存在随机输出和异常处理问题等,详细内容大家可以看下图的左边的表格。
AI Agent应用部署方面也面临着一些挑战,这里直接引用了langbase《state-of-ai-agents》报告中的调查与总结,详情见上图的右侧图表。
8、AI Agent-AI Agentic workflow-AI Agentic AI
AI Agent是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。Agentic Workflow是指通过预定义的多步大型语言模型(LLM)调用静态完成任务的工作流。Agentic AI是AI具备自主性的能力和行为,代表了AI所能实现的顶峰——独立行动、学习和适应的能力。
AI Agent向Agentic Workflow的发展以及Agentic AI的兴起,正推动行业效率提升和数字化转型。这些技术改变了企业运营模式,改善了客户体验,并为决策支持和自动化服务带来革命性变化。
同时,它们也延伸了应用价值链,改变了行业业态,尽管面临技术挑战,但为行业带来了前所未有的发展机遇。
第二部分:技术进展
1、AI Agent技术栈
AI Agent技术发展到现在,技术生态基本已经成型,用于构建AI Agent的各种技术正在不断完善。
下面两张图,左边是去年7、8月份投资机构Aura Ventures整理的市场全景图。其中涉及到了技术部分,他们通过技术表达的形式把相关公司或者产品列到了这种好难过图中。
大家可以清楚看到每一个技术和解决方案下面都列举了一些代表性公司。关于这张图的具体解读,可以参考图书第15.2.4节产业格局。
右边是Letta在今年11月推出最新技术栈统计。它也是从技术视角以AI Agent构建流程的形式,标明哪些技术由哪些技术供应商来提供。单从技术而言,多半年时间又有不少技术公司得到了市场认可。
在技术栈方面,大家可以重点理解《AI Agents Stack》这张图。左边这张图因为时间比较早可以作为参考,当然通过它可以整体把握AI Agent市场结构。
2、AI Agent技术生态图
在文章的开头,我们先介绍了翁丽莲提出的AI Agent技术架构。把这个架构图用技术和企业进行具象化,可以看到下面这张由 Activant Capital绘制的技术供应商角度的AI Agent生态系统图,也就是左边这张图。技术视角的架构图,可以帮助我们更好地理解智能体。
右边这张图则是关联技术厂商的一个具象化,它同时也是一个技术成熟与市场增长信念的象限图,每一种技术以及代表厂商都在这个象限中有合适的位置。通过这张图,我们也能看到这些技术及产品的市场发展潜力。
3、AI Agent技术进展
这里,也简单介绍一下AI Agent的技术进展。
基于大语言模型的AI Agent技术,正在快速发展与迭代。到2024下半年,大模型都向多模态发展,同时10月份OpenAI的o1模型开启了后训练时代,可推理、可视觉以及上下文协议等技术的应用,极大地推动了AI Agent在更多场景与领域的的应用。
大家可以看上面这张图的左边部分,这是大语言模型发展前景图。图片分为6部分,从左到右我简单的上面做了做了注解。短短的两年多的时间里,大模型已经迭代了多次使得AI Agent的功能和能力都在不断的提升和增加。
右边是当前的七种主流RAG(Retrieval-Augmented Generation,检索增强生成)技术架构图。能够有效解决AI Agent长期记忆问题的RAG技术,已经在短短的几年内发展出多种技术架构。
AI Agent技术框架不断推陈出新。这里列举了代表性科技企业微软和谷歌推出的部分AI Agent技术框架。这个图表中列举了微软的8种技术架构和解决方案,这只是其中一部分,实际上他们推出的相关技术还有很多。
包括谷歌也是一样,现在开始重点发力AI Agent。在技术社区,AI Agent技术框架更是百花齐放,预计2025年就开始卷多智能体、GUI(UI)智能体和端侧智能体了。
这里,也列举一些AI Agent的开源项目与闭源项目。下面的两个表格中列出的是已经推出AI Agent技术框架、产品及解决方案的开源与闭源项目。左边是开源项目,右边是闭源项目。
这些项目来自智能体沙盒技术供应商e2b的Github仓库awesome-ai-agents,它通过搜集和提交的方式来累积智能体项目。目前开源项目110个,闭源项目105个。
当然并不是说目前的AI Agent项目只有这些,还有大量相关项目并不在这个名单中。这里只对这些项目做了简单介绍,关于每个项目的具体介绍大家可以到Github去查阅。
第三部分:发展趋势
最后,我们再来看AI Agent在2025年的一些发展趋势。这里,我列举了五个趋势,如下:
-
AI Agent采用率显著增加
-
多模态Agent增强用户体验
-
多Agent系统开始流行
-
AI Agent集群与AI Agent网络
-
垂直AI Agent蓄势待发
关于发展趋势王吉伟频道就不多讲了,大家可以结合PPT内容去理解。
1、AI Agent采用率显著增加
AI Agent的采用率在未来一年将显著增加,各行各业的组织计划将其用于处理跨部门任务,如电子邮件生成、编码和数据分析等。据Capgemini报告,82%的组织计划到2026年集成AI Agent。
德勤预测,到2025年,25%使用GenAI的企业将部署AI Agents,到2027年将增长到50%。Gartner预测,到2028年,至少15%的日常工作决策将通过Agent AI自主做出,且33%的企业软件应用程序将包含Agent AI。
未来一年,还将出现专门从事金融、零售和医疗保健等领域的AI Agent。
2、多模态Agent增强用户体验
多模态AI Agent的兴起标志着AI能力的重大进步,它们能处理文本、图像、音频和视频等多种输入数据,为各行业带来广泛应用。
比如在医疗保健领域,这些Agent通过分析医学成像、患者记录和症状,提供更全面准确的诊断建议。在零售业,它们结合视觉识别与自然语言处理,打造更直观交互的购物助手。
在创意产业,如广告和设计,多模态AI Agent可生成融合文本与图像的内容,理解视觉与语言交流的细微差别,对创建针对性营销材料和个性化内容极具价值。
随着AI Agent在特定行业影响的增长,多模态AI处于转型前沿,其处理和合成多类型信息的能力更贴近人类认知过程,成为复杂决策场景中的重要工具。
3、多Agent系统开始流行
多Agent系统因企业对复杂解决方案的需求而开始流行,成为开发的中心。AI Agent将协作解决问题,执行多层决策任务,共享信息、协调行动,处理跨部门复杂工作流程。例如在物流领域,可优化供应链、管理库存、预测需求波动。
2025年,更多组织将部署多Agent系统管理优化业务流程,OpenAI Swarm和Microsoft的Magentic AI等Agent编排平台将引领这一趋势,助力企业协作部署管理多个Agent。
4、AI Agent集群与AI Agent网络
2025年,AI Agent将迈向更高层次的协作与协同工作阶段。Salesforce AI研究负责人Silvio Savarese预测,未来一年AI Agent将像蚂蚁一样成群结队合作,解决日常任务和业务挑战,以空前规模重新定义生产力和问题解决能力。
AI Agent将无缝融入生活,个人拥有个人Agent,组织部署专业Agent,这些Agent可通过Agentforce等平台获取,针对特定任务定制并协同达成共同目标。未来,AI应用将聚焦于创建和定制协作执行战略任务与决策的Agent,无论在个人还是商业环境。
5、垂直AI Agent蓄势待发
垂直AI Agent专注于特定行业或领域,利用AI技术自动执行任务、提高效率并部分取代人工。业内人士预测,其未来市场规模可能是SaaS市场的10倍,并有望在多领域取代SaaS。
从2025年起,凭借更成熟的技术和增长的用户需求,垂直Agent将迅速占领市场。
它们的主要优势是高度专业化和定制化,在特定领域表现优于通用智能体,具有高效率、快速响应以及经大量训练优化后的高稳定性和可靠性。应用领域广泛,涵盖医疗、金融、客户支持、市场研究与分析等。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。