大语言模型应用指南:function calling
作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming
1. 背景介绍
1.1 问题的由来
随着深度学习技术的飞速发展,大语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了令人瞩目的成果。LLMs具有强大的语言理解和生成能力,在机器翻译、文本摘要、问答系统等任务上表现出色。然而,将LLMs应用于实际项目中,却面临着诸多挑战,其中之一便是如何高效地调用LLMs的功能。
1.2 研究现状
目前,LLMs的调用方式主要分为两种:端到端调用和分步调用。
端到端调用是指直接将整个LLM作为一个黑盒进行调用,通过输入文本并接收输出结果。这种调用方式简单易用,但存在以下问题:
- 计算资源消耗大:LLMs通常具有庞大的参数规模,每次调用都需要消耗大量的计算资源。
- 延迟时间长:端到端调用需要完成整个LLMs的推理过程