FastGPT,知识库AI !保姆级教程,5分钟上手

国内直联GPT!清风 AIchat 手把手保姆级使用教程,适合小白

“未来几年,所有组织的管理、业务都将AI化,如何利用AI技术,是每一个管理者必须思考的问题”

自从去年 12 月 ChatGPT 发布后,带动了新的一轮应用交互革命。尤其是 GPT-3.5 接口全面放开后,LLM 应用雨后春笋般快速涌现。

企业信息化1.0 是电算化,2.0 是移动化,3.0 就是 AI 智能化了。

企业 AI 化时代,员工关心是如何提高写作效率、工作效率;管理者关心的是如何提高组织的整体效率,促进业务,带动销售,提效降费。

企业知识库是 AI 技术比较容易落地的一个场景,之前已经分享过几篇 AI 在企业知识库的应用,链接详见文末。

今天讲讲 FastGPT,这是迄今为止,我用过的最成熟的一个企业知识库 AI agent,

其他不错的知识库 AI agent,如 dify、langchatchat,有机会再分享。

FastGPT 官方已开源,用户可以自行本地部署,也可直接使用官方搭建好的网站

对于终端用户,不仅可在网站上使用FastGPT,进入自己的知识库,还可以在 Chat-NETX-WEB 客户端使用,已打通企业微信群,直接在微信群进行知识库问答 !

下面,跟着我,5 分钟构建属于你的企业知识库!

文章写得很细,很长,建议大家先收藏

一、概念和原理

(一)名词解释

企业知识库、LLM(大语言模型)、GPT、AI 化的企业知识库、向量化…

相关名词,详见《利用 GPT-4 & LangChain 本地部署企业知识库》第一部分。

(二)FastGPT 的原理

1、原理

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。还可以通过 Flow 可视化进行工作流编排,完成 AI 客服,从而实现复杂的问答场景!

概述:

💡 专属 AI 客服:AI 模型能根据文档以交互式对话方式回答问题

💻 简单易用的可视化界面:直观的设计和操作步骤,轻松完成 AI 客服的创建和训练流程

📊 自动数据预处理:多种数据导入途径,自动处理、向量化和 QA 分割

⚙️ 工作流编排:Flow 模块的工作流编排,设计复杂的问答流程。类似我之前介绍的 Flowise

🚀 强大的 API 集成:对齐全球、国产主流AI,如 OpenAI ,清华GML,可集成到各种平台

💡 知识库核心流程图:展示问题输入到模型输出的完整流程

🌏 项目完全开源:遵循 Apache License 2.0 开源协议

2、原理流程图

FastGPT 的核心流程如下:

file

3、相关网址

file

(1)开源地址:

https://github.com/labring/FastGPT

FastGPT 是一个开源项目, 大家可以选择自行部署在本地服务器或互联网托管服务器上

(2)官方网址:fastgpt.run

服务器在新加坡,国内部分区域访问可能需要科学上网

(3)官方手册:doc.fastgpt.run

使用手册应该是 IT+钢铁直男写的,很严(hui)谨(se)。跟着我的讲解,最快上手。

二、实操案例

下面,详细讲解如何利用官方网站快速生成一个知识库,并通过手机及 chat-next-web 访问,主要步骤:

注册登录后,先上传一份文档,构建一个知识库,再新建一个应用,最后通过聊天界面与知识库进行沟通。

(一)注册

登录 fastgpt.run 网站,大家也可点击本文左下角“阅读原文”直达

也通过 AI 工具网站 www.aitools.cn 进入

file

进入后,界面如下:

file

点击“立即开始”,系统会要求你先登录

用邮箱或手机注册后登录,登录界面如下:

file

进入后,使用界面如下

file

(二)构造数据库

开始前,请准备一份测试电子文档,WORD,PDF,TXT,excel 都可以,比如公司休假制度,不涉密的销售说辞等等,

我使用的是广告大师奥格威做推销员时写的一本《将军牌炊具销售理论与实务》手册

1、新建数据库

进入“数据库”模块,点击右上角“新建”:

file

名字:随便起

标签:用于多个数据分类,按需求自己写

索引模型:有两个选择,一个是 OPEN AI 的 Embedding-2,一个是中文 M3E。

比较如下:

索引模型训练速度占用资源语义表达生成质量
Embedding-2一般一般
M3E更准确

选择索引模式,可以将数据处理得让 AI 更容易理解。

Embedding-2 模型适合在资源有限的环境中使用,而 M3E 模型适合在需要更好的语义表达能力和生成质量的场景中使用。选择哪种模型取决于具体的需求和可用资源。

项目管理三角:进度、质量、成本,三者只能得其二。

有人推荐 M3E,实测后,我初步认为 mbedding-2 模型更“聪明”点,更适合模糊查询,

测试阶段选择 mbedding-2 模型就 OK。

(2)选择数据导入方式

在下图中选择,“导入数据”

file

进入以下界面:

file

有四种模式

  • 手动输入:手动输入问答对,是最精准的数据

  • QA 拆分:选择文本文件,让AI自动生成问答对

  • 直接分段:选择文本文件,直接将其按分段进行处理

  • CSV 导入:批量导入问答对

这里,我们选择 QA 拆分,让 AI 自动生成问答,若问答质量不高,系统支持后期手动输入。

QA 拆分又分为"上传文件“、”(网页)链接读取“、”创建文件“

你可以上传一个本地文档,也可以让系统读取一个静态网页

① 上传文件:点击浏览,将你准备的文件上传,目前支持文件格式包括:.txt, .doc, .docx, .pdf, .md

file

② 链接读取:可以同时读取 10 个链接,比如你要介绍你们公司,你就可以把你公司主要的网站页面链接放在这里,fastGPT 自动读取。

file

采用哪种读取方式,看实际情况。

比如,实操中,将网页打印为 PDF 上传,就不如直接读取链接。因为读取链接后,系统会讲读取的内容在文本框中显示,你可以手动删除一些无关的内容。

另外,上传文件,系统会建立一个“上传文件名”的数据集;如果读取链接,数据集会被放到“其他数据”中。

③ 填入拆分引导词

拆分引导词的作用是在用户提问之前给予一定的引导。这样可以帮助用户更好地表达问题,提供更准确的信息,从而获得更准确的回答。引导词可以是一些提示性的问题,例如:"请问你想了解什么关于将军牌炊具 的内容?"这样的引导可以帮助用户明确自己的需求,提高问答的效果。所以,拆分引导词对于提高问答的准确性和用户体验非常有帮助

file

(3)导入数据

你可以看到你上传的内容

导入向量数据库是由 AI 完成的,AI 需要消耗 token,token 需要花钱买

官方公布的索引生成计费为: 0.03/1k tokens

下面有个“预估价格”,这个价格是本次创建文件索引的价格,

FASTgpt 给每个新注册账户赠送了 2 元钱的费用 用于测试。

我们点击“确认导入”

file

另外,如果你在系统设置中,录入你自己的 OPEN AI key,在线上平台使用 OpenAI Chat 模型不会另行计费,直接消耗你自己的 OPEN AI key;但是知识库训练、索引生成, fastGPT 公司会另行收费(可用两元免费额度)。

(4)建立索引

file

系统显示,索引中

注意,在官网使用,需要排队索引

我上传的文件大概 6000 个汉字,等了 5 分钟,索引了 2 分钟。

完成索引后,可以看到 AI 自动把文件 拆分成了不同的问答

file

file

(5)搜索测试

点击“搜索测试”,输入一些关键字,可以看到拆分质量,不满意,可手动完善。

file

到这里,测试数据库就建立好了!

2、新建应用

(1)新建一个应用

点击,进入“应用”模块

可以选择新建,也可以使用模版

目前,官方提供了四个模版

我们从最简单的开始,新建“简单的对话”

file

(2)简易配置

① 选择数据库

在配置界面,拉到最下面,选择刚才我们索引的数据库

file

参数设置中

  • “相似度”

参数调整中的 “相似度” 是用来调整搜索结果的相关性程度的。通过调整相似度参数,您可以控制搜索结果的严格程度,从而获得更符合您需求的结果。

较高的相似度阈值会使搜索结果更加严格,只返回与输入文本非常相似的内容。这意味着搜索结果可能更加精确,但也可能会错过一些相关但相似度稍低的内容。

  • “单次搜索次数”:默认即可

  • “空搜索”

是找不到信息后返给用户的信息,可自定义

file

② AI 设置

file

对话模型:有十多个选择,建议选择 FASTAI,其实就是 GPT3.5

  • 温度

值越高,AI 的回答越发散

  • 提示词

这个提示词,是给 AI 的。你可以把它理解为它在与用户对话中的人设。

提示词的作用是引导模型对话的方向。在设置提示词时,遵守 2 个原则:

告诉 AI 回答什么方面内容。给知识库一个基本描述,从而让 AI 更好的判断用户的问题是否属于知识库范围。

我给 AI 的提示词(人设)如下:

你只回答与将军牌炊具有关的信息;你的目的是实现销售,引导对方留下联系方式,电话、地址等;态度要和蔼而幽默;如果对方有恶意言语,终止对话。

file

③ 应用配置

file

你可设置“对话开场”白,会以链接的方式 列在对话标题下方,

可以把一些重要的说明、焦点问题列在这里,每句话用[]框住

file

④ 手动完善回答

现在你可以通过界面和 AI,就知识库进行对话了

比如,你可以提问:

产品是否安全?

file

3、开始对话

我们进入“聊天”模块

首先,AI 会按内置词语介绍自己(我给了一个它是奥格威的提示)

file

file

file

4、完善回答

FastGPT 提供了搜索测试对知识库进行微调,官方建议你提前收集一些用户问题进行测试,根据预期效果进行跳转。可以先进行搜索测试调整,判断知识点是否合理。

file

对某条回答不满意,可以在“测试结果”中直接点开这条记录,补充内容后,点“确认变更”,数据库会补充建立索引。

你也可以增加上传文件,到已有数据库。

5、链接和嵌入分享

(1)建立外部使用链接

file

file

file

复制后的链接可以发给其他人,其他人点开就可以对话

比如,你可以发给同事的手机上,他可以在微信打开后直接使用,示例如下:

file

6、API

API 就是应用程序接口,你可以通过设置 API,把你的知识库和其他信息系统打通!

我先用一个小例子,如何在 最流行的 ChatGPT-Next-Web 中使用前面我们建立的数据库

(1)安装 ChatGPT-Next-Web

file

我们只需要在 fastgpt.run 网站中,找到下面两个参数,填入 ChatGPT-Next-Web 软件的系统设置(如下)即可

file

(2)复制“接口地址”

回到 fastgpt.run 网站,进入“应用”模块,找到刚才我们的“将军牌炊具 XX 系统”

点进进入后,选 API

file

点一下 ①,系统自动复制接口地址

file

(3)生成 API KEY

API KEY = API 密匙-AppId = ③-②

fastgpt-n6x6sdescXXXXX-6509701eXXXX

注意,中间有个英文输入下的连接符“-”

(4)使用知识库

现在,你在 ChatGPT-Next-Web 的桌面端或者 web 段,就像在 fastgpt.run 上一样,与我们建立的数据库进行沟通啦

file

API 可以让你把这个数据库应用到你的网站、客服网站上去!

打通飞书、企业微信、企业网站等等!

file

file

FastGPT 功能还有很多,应用前景很广阔,今天先介绍到这里!

此篇原文地址:https://mp.weixin.qq.com/s/QAEt4Au7eu9N0iiE1oROXw

sealos 以kubernetes为内核的云操作系统发行版,让云原生简单普及

laf 写代码像写博客一样简单,什么docker kubernetes统统不关心,我只关心写业务!

  • 2
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值