智能体技术“简史”


e6e262572c49169f7481635af09c9159.png

LLM三趋势

我能感受到大语言模型发展的三个趋势

1. 行业/领域大模型:基础模型之间的“百模大战”鏖战尚酣,在各个垂直领域的大模型和ChatGPT式的应用已纷纷探出头来。

2. 检索增强生成(RAG):RAG是由数据库、搜索和大语言模型自然语言处理技术等以流水线方式构建起来的问答系统。系统有效地结合大语言模型和传统的信息技术,部分解决了企业对信息安全的限制,控制了大语言模型所提供的幻觉知识,并提升了知识管理系统的体验和效率。

3. AI 智能体(Agents):智能体可能是AI技术最有意思、最有趣的发展。基于大语言模型的所赋予的能力,人们在应用软件中设计一些具有智能的角色,让它们自主工作、互相协作,产生最终结果。

AI智能体
智能体可以被看作是代理(Proxy)概念的进一步发展。代理模式(Proxy Design Pattern)早已成为面向对象软件设计的一个成熟模式。不过,一直以来,代理模式的程序代码结构复杂、随着所代理的对象新增功能,不断需要增加接口。这些复杂性严重限制了Proxy模式的能力。

现在的情况有了改变。大语言模型把原来只能在代码中才能实现的功能迁移到模型中,从而克服代码复杂性的问题;对象之间通过收发简单和统一的格式自然语言指令来完成接口,这进一步简化代码;大模型语言所承载的知识以及自然语言的理解和生成能力使Proxy智能化,也更强大。简单的代码结构、简单的接口和强大的智能大大降低了软件设计的门槛,使我们能够高度自动化和智能化地完成复杂的任务。

在日新月异的大语言模型技术发展中,也出现了一些有代表性的智能体项目。

  • 在2023年4月推出Auto-GPT。Auto-GPT可以根据人工输入的目标分解生成具体的任务并完成,它还可以自动为自己安排新的目标,从而实现更为宏大的计划。虽然Auto-GPT受困于大语言模型的幻觉和遗忘等问题,在现实中并没有产生重大成果,但它让我们感受到了智能体的潜力。

  • 如果说Auto-GPT是一个单智能体的典型案例,那么斯丹福大学2023年4月推出,8月开源的SmallVille则展示了多智能体协作的场景。在这个游戏般的虚拟世界里,25个不同角色的智能体“生活”在SmallVille村里,它们每天为自己自主地制定计划,与其它角色互动,并完成它们的计划。

  • 如果说SmallVille为我们展示了一个童话般的多智能体世界,那么MetaGPT则展示了多智能体协作如何形成真正的生产力。MetaGPT按照软件开发公司的组织和角色生成了智能体,包括软件产品经理、架构师、软件工程师、测试人员等,然后按照软件工程的流程让它们协作。产品经理智能体编写需求说明书,架构师智能体设计软件架构,软件工程师再根据架构设计编写代码 ... 通过多智能体之间的配合,MetaGPT可以生成能够运行的游戏(贪吃蛇、2048等)甚至像今日头条推荐系统那样的源代码和执行程序。

  • 如果说MetaGPT的多智能体协作还是基于特定业务(软件开发外包),那么最近微软推出了AutoGen,是一个更加通用的智能体软件开发框架。适用于各种不同业务。

AutoGen概述

a70e7261f42002b4e5c7f6441cd0cccf.png

代表着多智能体技术最新发展的AutoGen框架由三部分组成,

  1. 智能体定制(Agent Customization):应用可以结合大语言模型、各类软件工具和人机互动来定制业务逻辑;

  2. 多智能体对话(Multi-Agent Conversations):在这一部分,各智能体的对话协作,完成任务。

  3. 对话模式(Flexible Conversation Patterns):提供支持许多复杂的对话模式。比如,联合聊天(Joint Chat)模式,分级聊天(Hierachical Chat)模式等。

通过该框架,人们可以完成各种任务。以下是在微软相关论文中提供的一些例子,包括专业问答、检索增强、代码生成、各类群聊和国际象棋对弈等案例。

42d7b17f16451e98b31c118c4c7042bd.png

从代理到智能体,从单智能体到多智能体,从功能有限的多智能体协作到通用的多智能体开发框架,智能体技术正迅速发展。随着基础大语言模型的发展渐渐进入成熟期,我们迎来了丰富的、创新的、甚至是梦幻般的应用前景。

部分参考材料:
MetaGPT, https://github.com/geekan/MetaGPT

MetaGPT, https://www.oschina.net/p/metagpt

AI Agents: AutoGPT architecture & breakdown, https://medium.com/@georgesung/ai-agents-autogpt-architecture-breakdown-ba37d60db944

Computational Agents Exhibit Believable Humanlike Behavior, https://hai.stanford.edu/news/computational-agents-exhibit-believable-humanlike-behavior

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation, https://browse.arxiv.org/pdf/2308.08155.pdf

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值