智能体技术“简史”

最新推荐文章于 2025-03-20 11:50:15 发布

vastgrassland

最新推荐文章于 2025-03-20 11:50:15 发布

阅读量465

点赞数

本文链接：https://blog.csdn.net/vastgrassland/article/details/133759394

版权

LLM三趋势

我能感受到大语言模型发展的三个趋势：

1. 行业/领域大模型：基础模型之间的“百模大战”鏖战尚酣，在各个垂直领域的大模型和ChatGPT式的应用已纷纷探出头来。

2. 检索增强生成(RAG)：RAG是由数据库、搜索和大语言模型自然语言处理技术等以流水线方式构建起来的问答系统。系统有效地结合大语言模型和传统的信息技术，部分解决了企业对信息安全的限制，控制了大语言模型所提供的幻觉知识，并提升了知识管理系统的体验和效率。

3. AI 智能体（Agents）：智能体可能是AI技术最有意思、最有趣的发展。基于大语言模型的所赋予的能力，人们在应用软件中设计一些具有智能的角色，让它们自主工作、互相协作，产生最终结果。

AI智能体
智能体可以被看作是代理（Proxy）概念的进一步发展。代理模式（Proxy Design Pattern）早已成为面向对象软件设计的一个成熟模式。不过，一直以来，代理模式的程序代码结构复杂、随着所代理的对象新增功能，不断需要增加接口。这些复杂性严重限制了Proxy模式的能力。

现在的情况有了改变。大语言模型把原来只能在代码中才能实现的功能迁移到模型中，从而克服代码复杂性的问题；对象之间通过收发简单和统一的格式自然语言指令来完成接口，这进一步简化代码；大模型语言所承载的知识以及自然语言的理解和生成能力使Proxy智能化，也更强大。简单的代码结构、简单的接口和强大的智能大大降低了软件设计的门槛，使我们能够高度自动化和智能化地完成复杂的任务。

在日新月异的大语言模型技术发展中，也出现了一些有代表性的智能体项目。

在2023年4月推出Auto-GPT。Auto-GPT可以根据人工输入的目标分解生成具体的任务并完成，它还可以自动为自己安排新的目标，从而实现更为宏大的计划。虽然Auto-GPT受困于大语言模型的幻觉和遗忘等问题，在现实中并没有产生重大成果，但它让我们感受到了智能体的潜力。
如果说Auto-GPT是一个单智能体的典型案例，那么斯丹福大学2023年4月推出，8月开源的SmallVille则展示了多智能体协作的场景。在这个游戏般的虚拟世界里，25个不同角色的智能体“生活”在SmallVille村里，它们每天为自己自主地制定计划，与其它角色互动，并完成它们的计划。
如果说SmallVille为我们展示了一个童话般的多智能体世界，那么MetaGPT则展示了多智能体协作如何形成真正的生产力。MetaGPT按照软件开发公司的组织和角色生成了智能体，包括软件产品经理、架构师、软件工程师、测试人员等，然后按照软件工程的流程让它们协作。产品经理智能体编写需求说明书，架构师智能体设计软件架构，软件工程师再根据架构设计编写代码 ... 通过多智能体之间的配合，MetaGPT可以生成能够运行的游戏（贪吃蛇、2048等）甚至像今日头条推荐系统那样的源代码和执行程序。
如果说MetaGPT的多智能体协作还是基于特定业务（软件开发外包），那么最近微软推出了AutoGen，是一个更加通用的智能体软件开发框架。适用于各种不同业务。

AutoGen概述

代表着多智能体技术最新发展的AutoGen框架由三部分组成，

智能体定制(Agent Customization)：应用可以结合大语言模型、各类软件工具和人机互动来定制业务逻辑；
多智能体对话（Multi-Agent Conversations)：在这一部分，各智能体的对话协作，完成任务。
对话模式（Flexible Conversation Patterns)：提供支持许多复杂的对话模式。比如，联合聊天（Joint Chat）模式，分级聊天（Hierachical Chat）模式等。

通过该框架，人们可以完成各种任务。以下是在微软相关论文中提供的一些例子，包括专业问答、检索增强、代码生成、各类群聊和国际象棋对弈等案例。