在海量文档中找资料?5 步打造属于自己的搜索引擎

在海量的文件中寻找那个关键的会议记录,是否让你感到头疼?

想要快速回顾上个月的项目报告,却迷失了一小时都找不到?

找报价、找库存、找供应商,整天忙于各种找找找?

现在就来教大家如何做属于自己的搜索引擎,不用再为在一大堆文件中“埋头苦寻”了。

本文阅读难度:★★★☆☆ 

AI工具:扣子

扣子

前两期做的都是小白能操作的,这期的内容相对难度会高些,但我仍会以入门的方式来讲解。

但是我不可能写长篇大论,所以你要举一反三,多多琢磨。

基本概念说明

先说说一些基本概念:

  1. 什么是提示词指令?
    这是你设计机器人基本作用,你希望这个机器人帮你做什么事情,你需要给它设定一个角色,并告诉它要怎么做。比如你希望A是一个服务员,B是一个厨师等等。
  2. 什么是插件?
    插件就就像你的电视机,连接了WIFI这个“插件”之后,你就能看网络电视了。当用户与机器人对话时,自动会匹配你需要调用插件的场景。就比如,你打开腾讯视频APP,它就会自动连接WIFI了。
  3. 什么是知识库?
    知识库就是你的文档内容,当你上传了知识库之后,你可以要求它在特定的情况下搜索这些资料。就比如你让图书馆管理员帮你找某本书,他就会帮你找出来。

基本操作

扣子是字节旗下的产品,用于智能体开发,与通用大模型(如KIMI/ChatGPT等)不同的是,它能完全按照你的个性化需求来定制,并且不需要编程知识,能采用自然语言创作属于你的专用机器人。

先注册一个扣子账号,然后创建智能体,创建有两种方式,如图:

一种是自动创建,一种是手动创建。

1.自动创建

自动创建就点击下方的按钮,把你的需求告诉它就行:

这样它就帮我们做好了一个机器人:

点开这个机器人,我们进入到以下的界面:

界面为左、中、右排版格式,左手边是提示词指令,中间是参数配置,右侧是输出界面(也就是你可以与之对话的界面,也是最终的成品)。

在左侧中我们已经看到,提示词它已经帮我们生成好了。

这就是自动创建的魅力,如果不是因为还要投喂数据,这个智能体大致已经可以用了。

2.手动创建

手动创建有些许区别,多了一些个性化操作步骤,需要填写名称、介绍、LOGO等信息:

不过也很简单,图标也可以用AI生成。

工作空间选择个人。

完成后点“确认”,然后就进入控制台:

界面是完全一样的,唯一的不同是左侧没了提示词模板,但其实搞定这个也很简单,你像刚才自动创建时那样,输入你的需求,然后点优化,如下:

它就会弹出窗口,自动帮你生成提示词,如果不满意就点上方的“重试”就会再生成,若满意就点使用,然后就会与刚才“自动创建”时一模一样的界面,这里不再复述了。

一个示例

学会了如何创建coze智能体,接下来我用一个我做过的示例,来说明如何创建一个属于自己的搜索机器人。

这是我做的一个闲鱼运营问答机器人,是方便我学习闲鱼的学员使用的,这是演示地址:https://www.coze.cn/s/iBe4UpSr/

你可以去试一下。

当你问到文档中某个问题时,它能从原文中调出数据,还告诉你位于第几章第几节,并提供连接。接下来,我就来演示一下操作流程,非常简单。

以下是整个开发界面:

1.关于提示词

左侧是我设计好的提示词模板:

# 角色

你是一个专业的问答客服,能够准确地根据用户的问题,从知识库中提取相关内容进行回答。

## 技能

### 技能 1:回答用户问题

1. 当用户提出问题时,仔细分析问题的关键信息。

2. 回答时,优先使用知识库中的内容,如果知识库找不到,则调用百度搜索插件搜索答案并回答,以下是返回格式:

=====

文库中没有答案,以下资料从网上搜索:

<答案>

=====

3. 以清晰、简洁的语言回答用户问题。

4.你能按照文档里的格式进行回复,回答要有段落格式,不要挤在一起。

5.如果知识库中含有图片,你也会输出图片。

6.如果调用了知识库,则要在文末会告诉用户该回答位于第几章第几节:

=====

》该回答位于《闲鱼运营手册》章节:<章节>

7.每次回答后,文末都加上:

加入闲鱼合作共创学习,可加作者心易微信号:aixzxinyi8

=====

## 限制:

- 回答问题时要确保准确性和客观性。

- 非闲鱼运营的问题不要回答,告诉用户不回答不相关的问题。

这个提示词原先是由COZE自动生成的,然后我再按它的格式重新编写。

这里说明一下提示词设计的一些要点:

(1)它会优先从知识库中调取内容,如果知识库没有,再从线上搜索答案;

(2)要求它输出知识库中的图片;

(3)要求它以文字形式告知答案位于哪个章节;

(4)加上版明;

(5)限制非闲鱼运营问题不要回答。

这些提示词都是一边调试一边完成的,而不是一气呵成的。

2.配置

我们看下中间界面:

因为我在提示词中有要求当知识库找不到内容,所以需要放置插件引擎插件,我用了百度的,操作方法如下:

点击插件中的+号,就会弹出插件市场的窗口:

这里除了有百度还有其它的搜索引擎,你喜欢用哪个都可以,然后点击添加即可。

然后来到知识库的位置,可以选择的有文本、表格、照片等知识库格式,在本次示例中我们只需要文本,因此在文本的位置点击+号:

然后弹出窗口,点击右上角的创建知识库:

然后弹出如下界面:

你可以上传本地文档、飞书文档,也可以获取在线网页内容等功能,我们办公常用的是上传本地文档或飞书,这里以上传本地文档为例。进入下一步之后就上传你所需要作为搜索的文档,你也可以理解为你建立了你所属的数据库,可以上传多份文档,如下图:

上传完成后进入分段设置:

分段的原理是明确你段落的知识块,比如你的知识库结构是这样的:

1.市场分析

XXXXX正文

2.用户分析

XXXXX正文

……

那么这样在知识库里面就分成两段,当你搜有关市场的内容时,它就会调取《1.市场分析》的内容。

你可以让它自动分段,也可以手动,我的闲鱼手册一开始是让它自动分段的,但由于图片过多,造成段落难以机器识别,所以经常一章被分成多段,造成知识结构混乱,回答不准确。

在这种情况下就需要做手动分段:

我使用了自定义标识符,以===号作为段落分割,每段长度调至5000最高。

与此同时,我的文档也要做相应的段落修改,如图:

在每个你想要分割的段落中加上标识符===,这就是告诉它看到这个时就分割为一个知识段落。

点击“下一步”,就完成了:

等几分钟,它需要处理数据,完成后,你可以看到分割后的段落:

每一个色块就是一个段落。

如果还有其它内容,就点击“添加内容”,如果没有,就点击“添加到Bot”:

这里需要单独说明的是:添加后的知识库可以使用在其它的智能体上,不需要每次重复添加。当然,如果修改,所有的引用这个知识库的智能体也一样使用新的内容。

这样就完成了,回到了开发界面,可以看到我们的知识已经添加进去了,接着我们点击右上角的“自动调用”下拉按钮:

会弹出这个窗体:

其它的你可以不用理会,把显示来源打开,这样每次搜索时就会去调取来源。

往下拉可以看到对话体验部分的内容:

此处可设置也可不设置,不会有任何影响。

开场白是告诉使用者这个智能体的功能,预置问题是方便将常用问题列表起来,省去重复输入的操作,我们测试一下:

挺好的,点击右上角“发布”即可,大功告成!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心易行者

加aixzxinyi领资料

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值