智能体时代：Agent开发的三重境界

网安猫叔

于 2024-08-07 21:55:14 发布

阅读量901

点赞数 24

文章标签：人工智能机器学习语言模型 AIGC chatgpt

本文链接：https://blog.csdn.net/lvaolan/article/details/141002072

版权

在人工智能领域，Agent开发是一个不断演进的过程，它涉及到如何将AI技术与实际应用相结合，以提高效率、增强用户体验和推动业务发展。本文将探讨Agent开发的三个阶段，从基础的API使用到复杂的智能应用开发，逐步深入，帮助读者理解Agent开发的深层含义。

引言

随着人工智能技术的飞速发展，Agent（智能体）的概念已经从科幻小说走进了现实世界。Agent可以被理解为一种具有一定智能的软件实体，它能够自主地执行任务、做出决策并与其他系统交互。

Demo地址：https://github.com/q2wxec/langgraph-demo/tree/master/coalagent/

当作能理解语义的API使用

在Agent开发的初级阶段，我们可以将大语言模型视为一种能理解自然语言的API。这意味着，我们可以像调用任何传统API一样，向Agent发送请求，并期望得到一个经过理解和处理的响应。

在这个阶段开发的智能体，大多是在传统软件业务流程中，嵌入LLM的能力，对软件功能进行增强。对LLM使用局限在其对自然语言的理解能力上，应用场景大多局限在，文本生成、总结等方面，与传统软件开发调用各类工具的api的模式并无明显区别。典型用例如下：

短视频文案创作

我们可以将Agent作为一个内容生成器，输入视频的关键信息，Agent则能够根据这些信息生成吸引人的文案。这个过程可以看作是将Agent作为一个文本生成API来使用。

新闻日报总结

另一个典型的应用场景是新闻内容的自动总结。Agent可以接收大量的新闻数据，然后通过自然语言理解能力，提炼出关键信息，生成一份简洁的新闻日报。结合网页信息获取工具，我基于LangChain做了一个简单的新闻总结demo见github。

在这一阶段，Agent的开发主要集中在如何更好地理解和处理自然语言上。开发者在AI领域只需要熟悉自然语言处理（NLP）的基本原理，在AI工程上用到最多的也限于提示词优化，就能够利用现有的AI模型来实现这一功能。

当作自然语言编程工具使用

从API到编程工具的转变

在第二阶段，Agent不再仅仅是一个理解语言的API，而是一个可以进行自然语言编程的工具。这意味着，开发者可以通过自然语言来指导Agent完成更复杂的任务。

在这个阶段开发的智能体，不再局限于文本理解的场景。通过提示词工程，function_calling等方式，能够让大语言模型按提示要求格式化输出内容，进而在一定程度上能够重塑传统软件业务流程的多个环节，可以说是通过LLM进行自然语言编程应用。典型用例如下：

数据表汇总与去重

在这个场景中，Agent接收多个数据表，然后通过自然语言提示，自动进行数据汇总和去重，最终输出一份整洁的汇总表。使用LangGraph的流程编排，我实现了一个结合数据处理，过滤，去重，汇总的数据表汇总demo见github。

自动推动业务流程

通过AI执行意图识别，Agent可以在某些业务流程中减少人工审核环节，自动识别并推动流程的执行。
为了实现这一阶段的功能，开发者需要掌握提示词工程和function_calling等技术。这些技术允许开发者通过自然语言来指导Agent的行为，使其能够按照预期执行特定的任务。

当作真正的智能使用

在Agent开发的第三阶段，Agent被真正当作一个智能体来使用。这时，Agent不再只是一个简单的API或者工具，而是成为了一个具有自主决策能力的智能伙伴。

这个阶段的智能体开发，与大家理解的AI原生应用开发大体相同（虽然AI原生应用也没有一个规范统一的定义），但这个阶段的应用开发与传统软件开发的思维方式确实是完全不同了，LLM被真正当作智能来使用。

在软件开发时，可能更多要思考的是，这个事情如果是由一个人类团队来执行，

需要哪些角色（提示词Role限定）
这些相关角色需要具备哪些技能（tools绑定）
团队之间应该如何交互（state设置）
团队之间的工作如何流转（workflow的设置）

可以看到，这个阶段LLM不再作为API独立存在，而是绑定了角色和技能，并需要进行多个agent的组合，已经与人类智能的使用方式一致。典型用例如下：

Plan-and-Execute

Plan-and-Execute指的是涉及规划与执行两个主要步骤的过程，Agent需要根据给定的目标自主生成计划，并基于计划步骤自动执行任务，这要求Agent具备理解计划、制定策略并执行任务的能力。

例如，如果给定的任务是“计划一次从北京到上海的旅行”，那么大语言模型的“规划”步骤可能包括确定旅行日期、选择交通方式、预订住宿和活动等，而“执行”步骤则可能涉及生成详细的行程安排和必要的预订步骤。

作者结合搜索和自动问答工具，使用Plan-and-Execute做了一款搜索问答增强demo见github。

示例2：BabyAgI

BabyAGI是一个由开发者Yohei Nakajima创建的AI驱动的任务管理系统。它利用OpenAI和Pinecone APIs来创建、优先排序和执行任务

在这一阶段，开发者需要考虑的是如何将Agent与人类团队的工作方式相结合。这涉及到角色限定、技能绑定、状态设置以及工作流程的设置等多个方面。

结语

Agent开发的三重境界代表了AI技术从简单应用到深度融合的演进过程。随着技术的不断进步，我们有理由相信，Agent将在未来的软件开发中扮演越来越重要的角色。对于程序员而言，理解并掌握Agent开发的这三个阶段，将有助于他们更好地适应未来的技术发展趋势。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

网安猫叔

关注

24
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
智能体时代：Agent开发的三重境界

另一个典型的应用场景是新闻内容的自动总结。Agent可以接收大量的新闻数据，然后通过自然语言理解能力，提炼出关键信息，生成一份简洁的新闻日报。结合网页信息获取工具，我基于LangChain做了一个简单的新闻总结demo见github。在这一阶段，Agent的开发主要集中在如何更好地理解和处理自然语言上。开发者在AI领域只需要熟悉自然语言处理（NLP）的基本原理，在AI工程上用到最多的也限于提示词优化，就能够利用现有的AI模型来实现这一功能。
复制链接

扫一扫