论文地址:https://arxiv.org/pdf/2403.12881https://arxiv.org/pdf/2403.12881
1.概述
在深入探讨语言智能体技术时,我们观察到利用LLMs(大型语言模型)的卓越能力来感知环境、决策并行动,已成为应对复杂现实问题的有效策略。目前的研究重心主要集中在提示工程及多个闭源LLMs(如GPT-4)的框架调度上,以达成智能体任务的执行。尽管这些研究在成果与灵活性上表现出色,但闭源LLMs高昂的财务成本及潜在的安全问题成为其进一步推广的障碍。
近期,开源LLMs作为有力的替代方案崭露头角,并在多种应用中展现出积极的成果。然而,一个核心挑战依然存在:尽管这些LLMs在涉及语言技巧的任务中表现出色,但在作为智能体部署时,尤其是与基于API的模型相比,仍存在一定的不足。当前已有尝试针对特定垂直领域对LLMs进行微调