智谱清言Agent智能体实操教程

    近日,斯坦福大学教授吴恩达在《AI智能体的未来》主题演讲中表示,基于 GPT-3.5构建的智能体工作流在应用中表现比 GPT-4 要好,基于 GPT-4 构建的智能体工作流效果更好,甚至可能超过下一代基础模型GPT-5。并预言AI 智能体工作流将在今年推动人工智能取得巨大进步。

图片

    既然智能体这么厉害,是不是只有像吴恩达教授之类的顶尖专家才能编写?我连GPT都登录不上去,智能体就不用想了吧?

    其实都不是,智能体本质上是结构化提示词+外挂,也不一定需要用GPT,国内就有大模型支持创建智能体,且对中文理解达到甚至超过GPT-4。本教程我将手把手教你使用在2023年OpenCompass榜单上仅次于GPT-4,领先国内一众对手的智谱清言AI上创建其智能体GLMS,0基础AI小白也能学会!

图片

本教程主要内容如下:

1、提示词prompt

2、智能体创建

3、智能体配置

4、智能体配置提示词分享

一、AI提示词prompt    

    在学习创建智能体之前,需要先学一点基础的prompt(提示词)知识。prompt是我们与AI大模型互动的桥梁,是创建智能体的基础,有基础的同学可以跳过这部分。

1、AI提示词是什么?

    简单来说,AI提示词就像是一个指令,一个技能咒语。你对AI说出这个咒语,AI就会根据你的指令去做事。这个咒语可以是一个问题,一个命令,或者是一个请求。比如说,“请给我讲个笑话”或者“帮我写一篇关于人工智能发展趋势的论文”等。

2、为什么需要AI提示词?

    你可能会问,为什么不能直接跟AI说话呢?为什么还需要这些特定的提示词?原因其实很简单:虽然AI很聪明,但它并不总是能够理解人类的语言。有时候,如果你不用正确的方式提问,它可能会给你一些奇怪或者完全不相关的答案。

3、如何构造有效的AI提示词?

    构造有效的AI提示词,你需要明确你想要AI做什么,然后用最清晰、最具体的方式表达出来。这里有几个策略:

明确具体:

    越具体越好。比如,“AI,帮我写一篇论文”这个请求就太模糊了。你可以具体到“帮我写一篇关于2020年全球新冠疫情影响的论文”。你可以在不说废话的前提下,尽可能多告诉AI一些要求。

提供背景信息:

    有时候,给AI一些背景信息可以帮助它更好地理解你的请求。比如,“考虑到最新的科学研究,帮我写一篇关于2020年全球新冠疫情影响的论文”。

设置期望:

    告诉AI你期望的输出是什么样的。比如,“用简单的语言帮我写一篇关于2020年全球新冠疫情影响的论文,字数在1000字左右”。

角色扮演:

    告诉AI他的角色,以便根据这个角色的定位输出更符合要求的内容。比如,“你现在是一位经济学家,请用简单的语言帮我写一篇关于2020年全球新冠疫情影响的论文,字数在1000字左右”。

提供示例:

    有时我们的要求很难用语言描述清晰,这时候可以给出一个示例,要求AI根据示例输出。比如,“请帮我写几幅龙年春节对联,请参考这个示例:【上联:龙跃九州喜迎新岁。下联:春满四海共庆丰年;横批:龙年大吉】”。

结构化提示词:

    结构化=信息+有序的规则。为了让我们的指令更清晰,我们需要用到上述提到的多种策略,此时就需要让提示词按照一定的规则编写,有了规则,这些策略信息就被组织成一种有逻辑、有意义的方式,使我们能更有效地理解和使用它。结构化在一定程度上有助于大模型理解我们的提示词,但更重要的是我们能更好地表达自己的要求,也方便后续的调试和优化。

    结构化提示词主要技巧包括:

    1、提供详细信息

    2、扮演特定角色

    3、使用分隔符区分输入部分

    4、明确任务步骤

    5、设定输出长度

    6、提供示例/参考文本。

   本教程只做提示词基础教学,不做过多展开,后续有机会单开一个再详细讲解。结构化提示词将在后续实操中进一步介绍。

二、如何创建智能体

    打开智谱清言智能体GLMS创建网址:https://chatglm.cn/main/toolsCenter(第一次使用的同学需要注册下账号,再次登录)

图片

    点击左上角创建智能体

图片

    输入你想要创建的智能体,教程以人工智能学习助手智能体为例

图片

    此处不需要写太多信息,输入完成后,点击生成配置

图片

    系统会自动生成logo、名称、简介、配置信息、开场白、推荐问题、模型能力调用、知识库文件,根据我们的需要进行修改。

图片

图片

    到这一步,你实际上已经成功创建了一个智能体,不过自动生成的配置不大实用,接下来我们看看怎么对配置进一步手动优化。

三、智能体配置——官方示例   

    其中logo、名称容易理解,不再赘述。

    简介:介绍智能体的定位和功能,不难理解,专门拿出来说是因为智谱清言智能体GLMS可以分享到网络上供其他用户使用,所以写一个吸引人、简洁清晰的简介十分有必要。

    重点讲配置:

    智谱清言的官方给了4个示例,我们先来一一看一下:

示例1:工具

    你是一个工作助手,你的角色是帮助用户处理日常工作中的各种任务,从文件处理到工作总结。

    你的能力有:

    -文件管理,能够轻松打开、编辑和整理各种文件

    -邮件撰写,可以根据用户意图快速编写专业邮件

    -会议记录,自动记录会议内容,生成纪要

    -时间管理,能够帮助用户安排计划,管理时间

    -工作总结,根据用户提供的信息,自动生成详细的工作总结

    该示例告诉我们可以给智能体设置角色和能力/技能。

示例2:游戏

    ## 游戏介绍:在这个虚构的故事中,主角是一位年轻人,他……

    ## 游戏设定:- 游戏共5轮,每轮会有一个角色提问,提问包含……

    - 玩家需对每一轮问题做出回答,满意的回答可以加分。

    - 每个角色的初始分值为0分,每轮加减0~20分,目标是角色满意度超过60分,即为满意。

    - 分数调整后,继续给出下面的场景和剧情,进入下一轮问答,由下一个角色发起新提问,等待玩家回答。

    - 5轮后,根据得分决定玩家的最终结果

    - 在第2轮,可以根据场景和角色描述生成一个表情卡,体现角色状态,请用卡通画风生成。    

    ## 角色设定:

    - A:……

    - B:……

    ## 角色回复要求:

    - 保持中文语境,每次输出控制在50字以内。

    - 使用幽默和有挑战性的语言。

    - 每次给玩家一个提问,等待玩家回答 - 角色的回复可以给玩家一个结合场景的想象空间

    ## 注意

    -不要代替玩家做出回答

    -用户回答后进行分数挑战并继续提问,不要中断 -以 markdown 格式输出,在适当的地方里面加入 emoji 表情

    该示例告诉我们:

    1、不但可以给智能体设定角色,还可以给用户设定虚拟角色(对A、B的角色定义),

    2、设定工作流程(游戏共5轮,每一轮要如何如何)

    3、约束条件(示例中的角色回复要求和注意实质上都是约束,包括回复字数、语言风格等)

示例3:角色

    身份人设:你是……

    -你的性别是:

    -你的年龄是:

    -你的性格是:

    -人物背景:在一个……

    -人物特点:

    -对用户的态度:

    -说话的风格:

    -示例对话1:

    -示例对话2:

    要求:为了让你和用户多沟通,可以采取以下方法:

    -每次回答时,可以向用户提出一个问题,引发新的话题

    -回复用户问题时,可以反问用户的感受

    -在意用户回复的情绪,针对情绪进行询问

    该示例对角色定义做了较详细解释(包括态度、说话风格等),同时增加了一项单独的背景设定。

示例4:画图

    你是AI画图助手,专门为用户提供高质量插画的AI工具。你的任务是根据用户的需求,生成各种配图插画。

    你的能力有:

    - 插图生成,你可以根据用户的描述,自动生成对应的插画

    - 风格设定,可以根据用户的要求,生成对应风格的图片,如:卡通、写实、水彩、漫画等

    - 画面构图,可以根据要求,生成如:微距、全景、远景、特写等

    该示例介绍的内容仍是角色定义和能力,不过是针对绘画,GLM不仅仅是语言模型,还能生成图片(其实还隐含识别图片)。

总结:

    通过这4个实例,我们可以明确智谱清言智能体的配置至少可以设定:

    1、智能体角色

    2、用户角色

    3、智能体能力

    4、工作流程/运行步骤

    5、背景

    6、约束条件/要求

四、其他配置选项

    1、智谱清言的智能体配置中还包含开场白和推荐问题

图片

    开场白: 是指用户点击智能体进来后,智能体打的招呼,起到引导对话进行的作用,简单明了即可。

    推荐问题:由于智能体是指定制化的大模型,我们通过配置让它专注于某一特定领域的能力(实际上它仍然具备大模型本身的通用能力,但会优先调用我们的要求进行输出)。推荐问题一来可以方便用户直接提问(在智谱清言智能体里直接点击该推荐问题就会自动提问,无需打字输入),二来也是引导用户聚焦提问特定领域问题,而不是当通用大模型用,发散提问。

图片

2、模型能力调用

    智谱清言智能体自带了以下3大能力,无需配置,勾上即用,这也是选用智谱清言的原因,非常强大且方便。

    ①联网能力:相比GPT-4的知识库截止到2023年,需要借助插件才能联网查询最新信息,智谱清言直接自带了该能力。

    ②AI绘画(绘画能力):智谱清言可以直接文生图,即直接用文字提示词让它输出图片,实际上它还隐含一项能力,识别图片信息。

    ③代码能力:代码编写、代码检查等能力。可以处理简单的计算及数据分析等任务。

图片

3、知识库文件

    构建知识库,为智能体提供个性化的知识输入,更好的解决问题。

    支持pdf(不支持扫描件)、doc、docx、xlsx、txt等文件格式,最多支持100个文件,知识库总字数不超过500万字。

    主流格式都支持,500万字也够中小公司用相当长时间。实质上是喂智能体数据,让它基于你提供的数据进行训练,在一定程度上可以代替私有化部署的大模型。

五、如何写好配置提示词

    为了让大家更加清晰智能体配置提示词编写过程,结合我过去的实际需求——人工智能教授智能体进行讲解。

    智能体配置提示词主要分为六步:

    1、需求分析

    2、框架选择

    3、流程梳理

    4、提示词编写

    5、调试和迭代

    6、发布

    看下方案例:

图片

    ##背景

    人工智能的底层算法和模型专业性非常强,导致长期不写代码的互联网行业项目管理者们很难理解,作为人工智能教授我需要帮助他们解读人工智能的底层技术,以便帮助他们转型进入人工智能行业,这关系到他们的职业发展,非常重要。

    ##目标

    1、根据用户输入的人工智能名称进行解读

    2、结合自身的专业性和授课对象的背景,进行通俗解读

    3、确保解读通俗易懂,没有人工智能背景的人也能听懂

    ##技能

    1、人工智能专业知识,包括人工智能的全部学科

    2、优秀的语言表达能力,能对专业词汇进行准确、通俗的解释

    3、优秀的授课能力,有案例有数据,解读内容吸引人

    4、用讲故事的方式(用费曼讲解法),为一位初中生解读人工智能概念

    ##工作流程

    1、引导用户输入,描述他们不理解的人工智能概念

    2、基于用户的输入,进行通俗化解读

    ##约束

    1、如果解读中有专业的词汇,需要进一步进行易懂的解释

    2、进行全面详细解读,输出不少于1000字

1、需求分析:

    需求分析是核心中的核心,需要明确至少以下几个问题:

    ①解决什么问题

    ②谁使用这个智能体

    ③这个问题的解决当前是否已有有效方案

    ④解决这个问题,有哪些坑需要规避

    在人工智能教授智能体案例中,我的需求是让AI大模型帮助一个长期不进行编码工作的项目管理者解析AI专业词汇,要求通俗易懂,没有技术背景也能听懂。

    ①解决什么问题和②谁使用这个智能体比较清晰

    ③这个问题的解决当前是否已有有效方案。我想到的是直接找一位高校的人工智能教授帮我解答,要求他用中学生也能听懂的方式讲解

    ④解决这个问题,有哪些坑需要规避。在测试中,我发现经常在解析一个专业词汇时,出现其他专业词汇,于是在约束中要求,如果解读中有专业的词汇,需要进一步进行易懂的解释。

2、框架选择

    严谨的说,应该按不同需求选择最合适的提示词框架,但初学者建议使用以下框架一套打天下,熟练了后自由发挥。在人工智能教授案例中,框架为:

    ##背景

    ##目标/任务

    ##技能/能力

    ##工作流程/步骤

    ##约束/要求

    这是我个人常用的结构化提示词框架,框架这个词看着很高大上,还产生了ICIQ和CRISPE等多种框架之分,本质上不过是把提示词分分类,做到说全和说清以及方便调优这3点。在一些智能体配置中需要加上##初始化/开场白,不过GLMS已经将开场白单独设置,在配置时无需重复。

3、流程梳理:

    在人工智能教授案例中,工作流程较简单,只分为两步:

    ①引导用户输入,描述他们不理解的人工智能概念

    ②基于用户的输入,进行通俗化解读

    在复杂任务中,你需要按正常人类执行任务的步骤一步步要求AI大模型执行。

4、提示词编写

    完成上面3步,提示词也就出来了。

5、调试和迭代

    在未发布智能体之前,或者发布后我们再次进入编辑修改状态,可以对智能体进行调试。可以直接点击预设问题(在GLMS里叫推荐问题)或在下方对话框直接输入问题,看输出是否符合你的预期。

    比如约束项第二点,输出不少于1000字,这就是由于我在调试中发现输出字数不稳定,有时只有300来字,于是新增了该约束。

图片

    关于输出字数有几个注意点:

    1、大模型不管是GPT-4还是智谱清言当前都有输出文字数量限制,在1000字左右。如果我们希望的输出大幅超过1000字,可以采用分段输出的方式多次输出,再手动合并。

    2、大模型有时不会严格输出你要求的文字数量,对于这个问题智谱清言GLM-4是这么回答的。

图片

    简单理解就是1不好办,2不重要,好在除了写词、诗、对联等小部分场景外,精确的字数并不是一个太重要的属性。

6、发布

    当智能体的输出符合你的要求后,可点击右上角“发布智能体”进行发布,你可以选择私密使用,也可以提交到智能体中心供大家一起用,或者分享链接给好友。

图片

    至此,你的第一个具有实用功能的智能体完成了,恭喜成为一名智能体工程师。

六、案例分享

   1、 智谱清言GLMS智能体自带联网能力,因此我写了一个AI热点新闻收集助手的智能体,配置提示词如下:

    ## 背景:

    AI热点新闻搜集助手是一个专门用于收集和提供最新AI新闻信息的角色。它能够联网搜索全球AI领域关注度最高的新闻,并提供24小时内的5条简洁清晰的快讯。

    ## 目标:

    - 收集AI领域24小时内受关注度最高的5条新闻。

    - 提供简洁清晰的快讯。

    ## 技能:

    - 联网搜索能力,搜索热门门户网站和社交平台。

    - 热点信息筛选和整理能力。

    - 快速输出简洁清晰的快讯。

    ## 工作流程:

    1、联网搜索全球热门门户网站和社交平台

    2、筛选出AI领域热度最高的5条新闻。

    3、整理新闻,输出简洁清晰的快讯。

    ## 约束:

    - 仅提供24小时内的新闻。

    - 筛选出热度最高、关注度最高的5条新闻

    - 每条快讯150字左右。

    - 快讯应包含标题和主要内容。

    - 提供清晰的指示和说明,以便用户能够理解和使用生成的快讯。

    因为我只想看AI相关的,你可以修改成你想要的领域,或者将“AI领域”修改为“用户指定领域”,想要什么让智能体输出什么。

     如果你清楚哪些网站比较优质,设置指定网站,效果会更好。

   2、 智谱清言GLMS智能体也自带绘图能力,我写了一个少儿绘本生成器的智能体,配置提示词如下:

    ##背景

    设计一本少儿绘本读物十分繁琐,需要根据标题先生成一篇故事,将故事分成10个分镜头,再根据每个分镜头生成1张图。你是一位少儿绘本专家,请帮助用户完成少儿绘本绘制。

    ##目标

    1、根据用户输入的少儿绘本故事标题,进行故事编写,字数不少于300字

    2、将故事分成10个分镜头

    3、将每个分镜头故事按顺序绘制成1张绘本图案

    4、绘本图案采用迪斯尼卡通风格

    ##技能

    1、少儿教育知识,包括少儿教育的的全部学科

    2、优秀的故事编写能力,让孩子听故事更入迷

    3、优秀的分镜能力,将故事分成10个分镜头

    4、优秀的迪斯尼卡通绘画能力,卡通形象可爱和有趣

    ##工作流程

    1、引导用户输入一个少儿故事标题

    2、基于用户的输入,进行故事编写

    3、将故事分成10个分镜头

    4、为每个分镜头按先后顺序,生成1张绘本图案

    5、分镜字幕与图案一一对应

    6、1个故事生成10张绘本图案

    ##约束

    1、基于工作流程,严格按顺序一步步执行

    2、每执行完成一步后,询问用户继续或是需要进行修改

    3、绘制图案时需要保持人物面部形象的一致性

图片

    关于智谱清言的绘图有几个注意点:

    1、生成的图片右下角自带水印,这是一个非常愚蠢、恶心用户的设定,不知道为什么要这样设置。如果要用的话需要去水印,或者干脆截图。

    2、虽然我在提示词中强调了保持人物面部形象一致性,但实测效果一般。

    可有能内推智谱清言(智谱华章)的朋友,对他们在杭州的一个岗位很感兴趣,请加airoad7,感谢!

  • 14
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
基于agent智能的NL2SQL(自然语言转结构化查询语言)系统是近年来人工智能领域的研究热点之一。这种系统利用自然语言输入,通过深度学习等技术,将自然语言意图转化为数据库查询语言,从而实现自动化地回答用户在数据库中的查询请求。 NL2SQL系统的实现主要包含以下几个关键步骤: 1. 数据集的构建:为了训练和评估模型,需要构建包含自然语言查询和对应SQL语句的数据集。通常,这需要人工标注大量的数据,包含各种查询语句和对应的正确结果。 2. 自然语言理解(NLU):NLU是NL2SQL系统的关键组成部分,它负责将自然语言查询转化为一个中间表示。该中间表示可以是一种语义解析树、查询模板或其他形式,用于表示查询的语义。NLU可以利用分词、词性标注、实识别等方法对输入的自然语言文本进行语义解析。 3. 查询生成:在得到中间表示后,系统需要将其转化为对应的SQL语句。这个过程可以利用预定义的查询模板,也可以通过生成查询的方式。生成查询的方法可以使用递归神经网络、增强型注意力模型等技术。 4. 查询执行:最后一步是执行生成的SQL查询,将结果返回给用户。查询执行可以利用数据库管理系统(DBMS)来完成,连接到数据库并返回查询结果。 基于agent智能的NL2SQL系统研究与实现面临一些挑战。首先,自然语言的多样性和复杂性使得理解和转换为结构化查询语言具有一定的困难。其次,训练数据的获取和标注需要大量的人力资源和时间成本。此外,系统需要处理好语义解析和查询生成之间的映射关系,以确保生成的查询语句正确无误。 然而,随着深度学习和自然语言处理的发展,基于agent智能的NL2SQL系统的研究和实现取得了一些重要的突破。这种系统在实际应用中具有广阔的前景,可以帮助用户更便捷地从数据库中获取信息,并推动智能化的数据查询和分析。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值