AI第二课堂:基于大语言模型的智能体入门
大模型开发背景
大模型的固有缺陷
问题 | 解决 |
---|---|
不具备知识出现幻觉 | 使用外接知识库给LLM提供知识 |
无法解决复杂逻辑任务 | 多个LLM协同各司其职 |
不擅长数学运算 | 使用外接工具如计算器等 |
什么是大模型开发
1.开放的大模型API、本地部署的开源大模型
开放API如:GPT-4o、GLM、Qwen
本地部署如:GLM、Qwen、InternLM
2.外接知识库、外接专业工具,外接搜索引擎、天气查询、代码书写等接口
3.Prompt工程及流程化:
如何控制智能体的交互流程,如何构建Prompt使大模型更好地发挥作用
Prompt工程
Few-shot
使用少量例子给LLM作为上提示
提供示例:给出几个与任务相关的示例,帮助模型理解任务模式和要求。
比如:“以下是几个动物的描述:猫是一种可爱的宠物,喜欢追逐毛线球。狗是人类忠诚的伙伴,善于看家护院。请描述一下兔子。”
Zero-shot
不使用例子输入,仅使用指令
用清晰简洁的语言向模型描述任务,不提供示例。
例如:“请为我生成一篇关于环保的议论文。”
思维链,让LLM有思考的过程
Cot
思维链提示
引导推理过程:鼓励模型逐步展示其思考和推理的步骤。
例如:“要解决这个数学问题,我们先分析题目条件,然后逐步计算。请计算 3 + 5 = ?”
可控生成
使用prompt控制LLM生成我们想要的格式方便后期进行解析
明确具体指令:清晰地给出一系列具体的操作指令。
比如:“请按照以下步骤完成文本分类任务:首先,分析文本的主题;其次,根据预设的类别进行匹配;最后,给出分类结果。”
Agent
基本知识
Agent 是能够感知其环境,并在该环境中自主行动,以实现一系列目标的实体。
Agent = Model + Memory + Planning + Tools
特点
自主性:能够独立做出决策和采取行动,无需持续的人类干预。
感知能力:可以通过传感器或接口获取环境中的信息。
学习能力:能够从与环境的交互中学习,改进其行为策略。
目标导向:具有明确或隐含的目标,并努力实现这些目标。
学习能力:能够从与环境的交互中学习,改进其行为策略。
目标导向:具有明确或隐含的目标,并努力实现这些目标。