最近调研了利用llm大模型加上自己的知识库进行智能机器人问答。
1.背景
llm大模型的强大能力可以让llm大模型充当智能机器人进行问答,比如作为企业的智能客服,回答一些常见的问题。但由于llm模型主要是基于通用数据的,对于特定数据的回答就难以胜任了。这就衍生了基于知识库的ai大模型方案。
以阿里云的通义千问智能机器人为例,其技术路线如下:
基本思路就是文本进行拆分,然后embeding成向量,存储到向量数据库,作为知识库,然后问答时从知识库查询,将查询到的向量以及匹配的文本,作为背景知识 ,加上固定的prompt,引导llm模型输出答案,如下代码所示,{{context}}即为背景知识。
2.开源方案介绍
除了类似阿里等商业方案,对于中小企业,可以考虑轻量级的开源方案。
调研了几个开源方案,从部署难易程度上选择了fastgpt。
2.1 fastgpt
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景。
其技术栈如下:
fastgpt提供了基础的docker部署脚本,默认用openapi的接口,所以只需要一个openapi的token即可,考虑到openapi对国内有限制,可以考虑将服务器部署到国外服务器;当然也可以申请国内llm的token,比如百度文心一言、火星大模型等。
具体参考官方教程,熟悉docker的话,参考说明文档,修改openapi的token即可,还是比较简单的。
https://doc.fastgpt.in/docs/installation/docker/
缺点是fastgpt的web端代码中不分代码写死了,比如有些地方固定用了中文的界面,对于英文应用稍显不足,不过也可以自己修改代码,编译之后更新docker容器。
fastgpt的模式是创建应用,然后应用可以关联知识库,知识库通过上传文档或者自定义生成,集成分成html链接和api 2种方式。
对话接口文档,主要配置appIDd,chatId和messages内容,messages指定role和content。
如果只是简单应用,可以考虑fastgpt,快速简单。
2.2 Langchain-Chatchat
Langchain-Chatchat主要利用langchain思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。通过使用FastChat接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型,依托于langchain框架支持通过基于FastAPI提供的 API 调用服务,或使用基于Streamlit的 WebUI 进行操作。
2.3 quivr
quivr构建了一个完全可控的知识库问答平台,支持docker部署,需要额外部署或者申请Supabase。
用法也比较简单,定义知识库,上传文档,问答时选定知识库即可。
文档支持更丰富,如Text, Markdown, PDF, Powerpoint, Excel, CSV, Word, Audio, Video。
2.4 DB-GPT
DB-GPT是一个开源的数据库领域大模型框架。目的是构建大模型领域的基础设施,通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。
DB-GPT功能更强大,不仅支持文本问答,还支持图表展示。
如何学习AI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
![](https://img-blog.csdnimg.cn/img_convert/be395633a2b7b55d7bd10c92e551bc70.png)
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。