先展示效果,我是基于GPT3.5搭建测试的。
直接将这个网站的一些产品文档用接口提交到知识库了,然后可以在飞书直接进行问答
相信有很多企业,甚至个人,想要 chatgpt 能够回复一些可控的内容。比如企业员工手册,产品的产品文档,用来当智能客服。甚至一些原有的搜索检索内容,都可以改造成智能问答的形式重新设计。对个人来说,你的一些研究资料,也可以做成知识库成为你的第二大脑。
整套模式,技术上其实已经成熟了,但是在数据处理等各种细节方面,包括向量库的维护方面,还是有很多技术复杂度,不利于大家快速的搭起一个可用的东西,有很多学习成本。
在这个背景下,开源的技术方案就不讨论了,有动手能力的人,自己写、自己运维肯定没问题。无代码无服务器的成熟产品国外也有一些,比如典型的https://www.chatbase.co/这个产品可以让你快速构建一个自己数据的对话 chat ,然后快速集成到自己前端页面当成一个产品的智能客服。但是这个东西集成到网页对国内用户来说是没有价值的,而且他定价也比较贵,起步都是 19 美元月。
如果你自己用开源方案构建,你至少需要一个成熟的向量数据,pinecone 70 美金的起步价格就更贵了。还有其他服务器和运维成本。
今天向大家介绍的这个方案,是基于GPT模型构建的垂直数据知识库,可以使用GPT3.5,也可以使用GPT4,目前还可以直接集成到飞书,成为飞书群内的一个智能人。
- 访问 https://aiproxy.io 登录账号,完成少量积分充值,如果测试用,21元档位就可以使用很久。白嫖是没戏了,毕竟OpenAI接口要收费,但比海外动辄几十美金起步,玩一玩的成本还是挺低的。
2. 有了账号,有了积分后,可以开始进入知识库页面,创建一个知识库。
进入知识库页面创建一个知识库
设置知识库的基本信息
3. 完成知识库创建后,列表页面点击知识库的名字,可以进入知识库管理页面,去上传你的知识文档。提交网页链接功能暂时还没开放,但可以把本地的doc、pdf、txt文档直接传上来。如果是开发者,可以看接口文档,通过接口来提交网页链接开发者接口
这个上传文档的内容,目前根据测试情况来看,段落分明,结构清晰的纯文本,效果较好。复杂的pdf格式,或者带图片信息的,效果都不太好。这里建议将内容整理到doc或者txt上传,文件名可以起的有意义一些。
4. 完成知识库的创建后,就可以在知识库页面点击聊天窗口进行效果测试了。也可以直接到应用程序管理页面,直接集成到飞书。
集成到飞书的流程
通过飞书开放平台创建企业自建应用
进入应用-凭证与基础信息页面获取App ID和App Secret
进入事件订阅页面,获取Encrypt Key。这个页面还可以做请求地址配置,在aiproxy得到请求地址后,回到这个页面配置。
进入权限管理页面,开通应用发送消息权限,权限名称im:message:send_as_bot,这个权限的作用为,将AI生成的内容以消息形式回复到飞书。
在同一个权限页面,开通应用接收消息的权限点,im:message.group_at_msg、im:message.group_at_msg:readonly、im:message.p2p_msg、im:message.p2p_msg:readonly,这些权限点的作用主要为群聊中@机器人、个人以私聊形式发送消息的一些场景,可以根据飞书的权限点描述,以及您的功能需要决定是否开通。如果没有开通任何收消息的权限,将无法接收用户请求。
在事件订阅页面,添加接收消息事件。这一步的作用为用户在和应用有消息交互时,应用能够收到消息。
在获取到上面的App ID、App Secret、Encrypt Key应用信息后,即可到aiproxy的应用创建页面,填写上述信息,完成应用创建。
完成应用创建后,可以得到一个唯一的事件接收地址,类似:https://api.aiproxy.io/api/feishu/event/jepxxxw4 回到刚才飞书的请求配置地址,保存后既完成配置。
配置完成后,就可以去飞书问答测试了。我实际测试经验来看,GPT3.5在这个场景的表现,就已经非常厉害了。如果输入提问文档中没有明显提及的提问内容,但基于阅读理解,可以推断出一些答案的,此时GPT4的表现非常强劲,就像真的阅读理解了内容一样。
最后提醒各位注意数据安全,这个产品是新加坡运营的服务,并且知识学习和最后阅读理解问答环节也是依赖OpenAI模型实现,一些机密数据,避免上传。
附上一个邀请码,首充有3%额外奖励:AIProxy