论文阅读笔记
文章平均质量分 97
论文阅读笔记
酿久诗
彼南风兮舒以肆
展开
-
《The Rise and Potential of Large Language Model Based Agents: A Survey》全文翻译
长久以来,人类一直在追求等同或超越人类的人工智能,而 AI 代理被认为是实现这一追求的有效手段。agent是能够感知环境、做出决策并采取行动的人工智能实体。自 20 世纪中期以来,人们已经为开发 AI 代理做出了许多努力。然而,这些努力主要集中在算法或训练策略的进步上,以增强特定任务上的特定能力或表现。实际上,我们所缺乏的是一个充分且强大的模型,来作为开发可适应各种不同场景的 AI 代理的基础。具有多样且卓越能力的大语言模型,则被视为通向通用人工智能的必经之路,也为构建通用 AI 代理提供了希望。原创 2023-09-22 23:03:14 · 2244 阅读 · 0 评论 -
《BloombergGPT: A Large Language Model for Finance》全文翻译
NLP 在金融技术领域的应用是广泛而复杂的,其应用范围包括情感分析、命名实体识别和问题回答。大型语言模型(LLMs)已被证明在各种任务中是有效的;然而,文献中还没有报道过专门用于金融领域的 LLM。在这项工作中,我们提出了 BloombergGPT,这是一个 500 亿参数的语言模型,在广泛的金融数据上进行训练。我们根据彭博社广泛的数据来源构建了一个 3630 亿个标记的数据集,这可能是迄今为止最大的领域专用数据集,并从通用数据集中增加了 3450 亿个标记。转载 2023-09-20 17:26:11 · 1533 阅读 · 0 评论 -
《Playing repeated games with Large Language Models》全文翻译
大型语言模型 (LLMs) 正在改变社会并渗透到各种应用中。因此,LLMs 会经常与我们和其他代理互动。因此,了解 LLMs 在互动社交环境中的行为具有巨大的社会价值。在这里,我们建议利用行为博弈论来研究 LLMs 的合作与协调行为。为此,我们让不同的 LLM(GPT-3、GPT-3.5 和 GPT-4)彼此以及与其他类似人类的策略进行有限重复的游戏。我们的结果表明,LLMs 通常在此类任务中表现良好,并且还发现了持久的行为特征。原创 2023-09-18 15:07:56 · 670 阅读 · 0 评论 -
《Exploring Large Language Models for Communication Games: An Empirical Study on Werewolf》全文翻译
交流博弈,我们称之为严重依赖自然语言交流的不完全信息博弈,在经济学、社会科学、人工智能等领域具有重要的研究价值。在这项工作中,我们探讨了如何在交流游戏中使用大型语言模型(LLM)的问题,并作为回应,提出了一个免调优框架。我们的方法使 LLMs 保持冻结状态,并依赖于对过去的沟通和经验的检索和反思来进行改进。对具有代表性和广泛研究的通讯游戏 “狼人杀” 的实证研究表明,我们的框架可以有效地玩狼人杀游戏,而无需调整 LLMs 的参数。原创 2023-09-16 15:57:28 · 968 阅读 · 0 评论 -
《AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents》全文翻译
由大型语言模型(LLM)支持的自主代理已经取得了显着的改进,使它们能够泛化广泛的任务。然而,在现实场景中,往往需要个体之间的合作来提高任务完成的效率和效果。因此,受人类群体动力学的启发,我们提出了一个多智能体框架 AGENTVERSE,它可以协作、动态地调整其组成,成为一个大于各部分之和的系统。我们的实验表明,AGENTVERSE 框架可以有效地部署优于单个代理的多代理组。此外,我们深入研究了在协作任务完成过程中群体内个体代理之间社交行为的出现。原创 2023-09-15 21:05:01 · 615 阅读 · 0 评论 -
《Graph of Thoughts: Solving Elaborate Problems with Large Language Models》中文翻译
我们引入了思想图(GoT):一个框架,它可以提高大型语言模型(LLM)中的提示能力,使其超越思想链或思想树(ToT)等范式所提供的能力。GoT 的关键思想和主要优点是能够将 LLM 生成的信息建模为任意图,其中信息单位(“LLM 思想”)是顶点,边对应于这些顶点之间的依赖关系。这种方法可以将任意的LLM思想组合成协同结果,提炼整个思想网络的本质,或使用反馈循环增强思想。我们证明,GoT 在不同任务上比现有技术具有优势,例如,与 ToT 相比,排序质量提高了 62%,同时成本降低了 31% 以上。原创 2023-09-09 15:39:36 · 1113 阅读 · 0 评论 -
《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》中文翻译
语言模型越来越多地被部署用于解决各种任务中的一般问题,但在推理过程中仍然仅限于令牌级、从左到右的决策过程。这意味着他们可能无法完成需要探索、战略前瞻性或初始决策发挥关键作用的任务。为了克服这些挑战,我们引入了一种新的语言模型推理框架“思想树”(ToT),它概括了流行的“思想链”方法来提示语言模型,并能够探索连贯的文本单元(“想法”)作为解决问题的中间步骤。ToT 允许 LM 通过考虑多种不同的推理路径和自我评估选择来执行深思熟虑的决策,以决定下一步的行动方案,并在必要时向前看或回溯以做出全局选择。原创 2023-09-09 12:39:30 · 547 阅读 · 0 评论 -
《Human-level play in the game of Diplomacy by combining language models with strategic reasoning》翻译
尽管在模仿人类语言方面取得了很大进步,但构建能够与人类在交互环境中有意识地进行通信的代理仍然是一个重大挑战。我们提出了西塞罗(Cicero),这是第一个在外交游戏中达到人类水平表现的AI代理,外交游戏需要在七个玩家之间进行自然语言协商和战术协调,既需要合作又需要竞争。西塞罗将语言模型与计划和强化学习算法相结合,通过推断其对话中的玩家的信念和意图来生成对话以追求其计划。在一个匿名的在线外交联赛的40场游戏中,西塞罗的平均得分是人类玩家的两倍多,在参与一场或多场游戏的参与者中名列前10%。原创 2023-09-08 21:56:06 · 296 阅读 · 1 评论 -
《Communicative Agents for Software Development》全文翻译
软件工程是一个复杂的领域,通常需要仔细的决策过程,往往依赖于细微的直觉和咨询。近些年深度学习技术的进步开始改变软件工程实践,通过在软件开发各个阶段的精心设计来实现软件工程的革新。本文提出了一个创新的范式,利用大型语言模型贯穿整个软件开发过程,通过自然语言交流简化并统一关键过程,因此无需在每个阶段使用专门的模型。这个范式的核心是 CHATDEV,一个由虚拟聊天驱动的软件开发公司,它严格遵循瀑布模型,将开发过程细分为四个不同的顺序阶段:设计、编码、测试和文档编制。原创 2023-09-03 21:04:25 · 1124 阅读 · 0 评论 -
《Scientific discovery in the age of artificial intelligence》全文翻译
在我们的实现中,当智能体感知到的最新事件的重要性分数之和超过一定阈值时,我们就会生成反思。这种行为的基础是一种新颖的智能体架构,它将一个大型语言模型与合成和检索相关信息的机制相结合,以在语言模型的输出上进行条件控制。作为独立的个体,生成式智能体是否正确地检索过去的经验,并生成可信的计划、反应和思维?:虽然一个大型的语言模型可以根据情境信息产生可信的行为,但智能体需要在更长的时间范围内进行规划,以确保他们的行动序列连贯且可信。:计划描述了智能体未来的一系列行动,有助于保持智能体的行为在时间上的连贯性。原创 2023-08-07 21:21:34 · 735 阅读 · 0 评论 -
Semantic Human Matting 阅读笔记
文章目录1 概要2 Human matting dataset3 实验1 概要题目:Semantic Human Matting - ACMMM2018作者:Quan Chen, Tiezheng Ge, Yanyu Xu, Zhiqiang Zhang, Xinxin Yang, Kun Gai团队:Alibaba, ShanghaiTech University 论文针对人像抠图问题,创建数据集和提出 Semantic Human Matting(SHM)方法。2 Human matt原创 2021-10-12 11:01:19 · 961 阅读 · 0 评论 -
Robust High-Resolution Video Matting with Temporal Guidance(具有时间引导的稳健高分辨率的实时视频抠图) 阅读笔记
文章目录1. 概要2. 模型结构2.1 编码器2.2 循环解码器瓶颈模块上采样模块输出模块2.3 深度引导滤波器模块(DGF)3. 训练策略4. 实验论文:Robust High-Resolution Video Matting with Temporal Guidance1. 概要 大多数现有方法将视频数据视为一帧帧相互独立的图像加以处理。与此不同,本文利用一个循环架构来发掘视频中帧与帧间的时间信息,显著提高了时间一致性和抠图质量。同时,提出一种新的训练策略,同时用匹配和语义分割目标来训练网络,使原创 2021-10-11 17:57:39 · 3042 阅读 · 0 评论