《AI打工摸鱼笔记》LLM+本地知识库自动填写售前技术调研表

随着AI工具的普及,使用大模型对于普通打工人来说已经没有门槛了。本文介绍如何使用本地大模型工具, 不编写任何代码,实现基于RAG的对售前技术调研文档的填写功能。

今天和大家讲一下我怎么用 LM Studio、Anything LLM、Streamlit 来实现本地的 RAG 功能, 同时让其帮自己『打工』。打工的内容我只是列举了一个简单场景,大家有类似的工作内容都可以依照 此方法来实现。

文章内容:

  • 背景需求和设计思路

  • Anything LLM 使用

  • 基础版AI员工(LM Studio + Anything LLM + 知识库)

  • 高级版AI员工(Streamlit 程序「下篇」)

介绍

LLM 大模型如今已经走进了寻常打工人的电脑上,我猜大家用的最多的功能还是在线聊天的文本生成吧。其实我们可以尽可能让AI帮我们快速完成工作,而不仅仅是把应用限制在问答上。

谷歌 Gemini AI 聊天程序

大家可以把日常的工作内容或者场景留言给我, 我们一起讨论下如何让 AI 帮我们打工的可能性。

售前(Pre-sales)

大致讲一下售前是个啥。

销售售前(Pre-sales)团队在销售过程中起着关键作用。他们负责技术支持和咨询,以帮助销售团队赢得新客户和合同。售前团队的主要职责和工作内容有:

1. 需求分析:售前工程师与潜在客户合作,了解他们的业务需求和技术要求。这有助于确保提供的解决方案能准确满足客户的需求。

2. 产品演示:售前团队通常会进行产品演示,展示软件的功能和优势。这些演示通常包括现场演示、网络研讨会或产品试用,以展示产品的实际应用和效果。

3. 解决方案设计:基于客户的需求,售前团队设计定制化的解决方案。这可能包括软件配置、集成方案和功能定制,以确保产品能完全符合客户的业务流程和技术环境。

  1. 技术咨询:售前工程师提供技术咨询,回答潜在客户关于产品功能、性能、兼容性等方面的问题。他们需要深入了解产品的技术细节和行业标准,以便提供准确的信息。

5. 编写技术文档:售前团队通常会编写技术文档和提案,包括解决方案建议书、白皮书、技术规格书等。这些文档帮助客户更好地理解解决方案的细节和优势。

6. 投标支持:在参与招标项目时,售前团队协助准备投标文件,确保所有技术要求和规范都得到满足。他们可能还会参与投标演示和答辩。

7. 客户培训:在客户决定购买产品后,售前团队可能会参与客户培训(小规模小范围),帮助客户熟悉和有效使用软件产品。

8. 市场调研:售前团队还需要了解市场动态、竞争产品和行业趋势,以便为公司提供市场情报和反馈,帮助改进产品和销售策略。

9. 内部协调:售前团队与销售、产品开发、客户支持等内部团队紧密合作,确保客户需求被准确传达和满足。这种协作有助于提升客户满意度和产品质量。

上面有一项技术咨询,就用到我了。

我虽然不是售前团队的,但是作为技术产品团队的一员,也经常在客户问到某些专业(也可能不是那么专业) 的技术问题,销售售前团队无法回答时,去支持一下。

常见的一个任务就是,客户给一个他们的《技术标准项》,或者《供应商产品技术调研表》这样的东西, 让我们去填写,然后由客户初步判断一下我们公司产品在技术层面和他们的匹配度。

不同客户的技术调研内容不一样,可能涉及架构、功能、安全、性能、运维等五花八门的问题。

方案

旧的工作方式

每次拿到技术调研表,当然是一条条的去写,如果之前有资料的那么就拷贝一些内容过来。

不过每家的问题组织方式都不一样,导致很多问题不能直接拷贝,还要组织语言。

新的工作方式

新的方式当然是让 AI 尽可能帮我们完成工作,我们设定初级和中级两种工作方式:

  • 初级:输入调研表的一个问题,让AI给出答案

  • 中级:直接把给定格式的 Excel 丢给AI程序,自动回答所有问题

由于设计到工作内容和客户隐私,这部分数据(自己公司的技术资料、客户的调研表)肯定不能放到网络上, 这样就需要本地的大模型(LLM)来支持。

实现上面的功能我们需要如下三个工具:

  • LM Studio:本地的大模型

  • AnythingLLM:知识库 RAG

  • Streamlit:读取和展示 Excel 的界面工具

前面两个工具直接安装就好了,不需要编码,可以实现咱们提到的初级能力。

LM Studio

LM Studio 是一个可以让你本地运行任意大模型的工具。

Anything LLM

Anything LLM 的宣传语是 『The all-in-one AI application』, 也就是一体化的 AI 应用程序。号称支持任意大模型(LLM), 任意文档, 任意 AI 代理, 完全私有。可以执行 RAG、AI 代理等功能,且无需担心代码或基础设施问题。

Anything LLM 网站

当然 Anything LLM 也可以为企业或组织提供完全可定制的、私有的、一体化的 AI 应用程序, 基本上是一个具有许可的完整 ChatGPT,并且具有任何 LLM、嵌入模型或矢量数据库接入的能力。

下载安装,打开可以看到程序界面:

Anything LLM 客户端界面

点击设置按钮:

Anything LLM 设置按钮

LLM 设置

首先设置 LLM ,我们再「大模型供应商」里面选择 「LM Studio」,以及对应的模型。

Anything LLM 设置界面

LM Studio 端口如果是用默认端口启动 LM Studio,那么直接选择 「LM Studio」这个供应商就可以了, 如果是改了端口运行的 LM Studio,那么选择供应商之后,还需要修改 LM Studion Base URL 的地址端口才可以选择到模型。

向量数据库设置

接着设置向量数据库,使用默认的 LanceDB,这样就不用安装向量数据库了。

Anything LLM 设置向量库

嵌入模型

嵌入模型同样使用 LM Studio 的,前提是要在 LM Studio 先下载好嵌入模型啊。

Anything LLM 嵌入项设置

余下的设置使用默认即可。

工作区

Anything LLM 有工作区的概念, 工作区使用允许的聊天方法设置聊天机器人的运行方式。有两个选项:

  • 聊天:聊天机器人将回答所有问题,无论其上下文如何。

  • 查询:聊天机器人只会响应与工作区中的文档相关的聊天。

以及这个工作区使用的 LLM 配置,

  • 大模型是哪个(可以继承全局设置)

  • 聊天的历史记录数

  • 聊天系统提示词:定义 AI 生成响应的上下文和指令

  • LLM 的温度

每个工作区有独立的向量存储和配置:

  • 当前存储库的标识和向量数量

  • 向量库的最大上下文片段:控制每次聊天或查询将发送到 LLM 的上下文片段的最大数量。

  • 文档相似性阈值:文档与聊天相关所需的最低相似度分数。数字越高,来源与聊天就越相似。

我们创建一个工作区:

创建新的工作区

设置查询模式:

设置聊天模式为「查询」

记得保存配置,不然不生效哦:

更新工作区,保存设置

知识准备

我们先看一下调研表大概长什么样(内容当然是我虚构的了 🌈),

技术调研表

上面这个调研表是用 GPT 生成的,看描述其实回答是否就行了,我们暂且那这个做例子。

为了自动填写技术调研表,肯定要有知识储备了,总不能让我们的大模型随便答吧。

我们都知道,对于大模型来说,越优秀的训练数据越能训练出高性能的大模型。对于我们的知识问答一样,知识数据的质量好坏也直接决定了我们程序给出答案的质量。

构建技术数据我们遵从如下几个原则:

  • 数据尽量采用标题-内容的模式(问答)

  • 当然您也可以直接使用公司内的产品设计、技术设计文档

  • 所有数据都由人工确认

  • 数据需要跟随使用人工增加和更新

由于基础资料不会太多,而且企业要求「不能出错」,所以人工检查和人工维护是必须的。

为了方便起见,我们每个类型维护一个 Markdown 文件。

架构设计说明(内容也是虚构演示用的哦)

Anything LLM 目前本地版本只支持文本格式的文件,不支持 Excel、PDF 啥的。

上传文档

我们点击工作区旁边的上传按钮:

工作区上传文档按钮

打开上传界面之后,

  1. 上传文件 it-01.md

  2. 选中上传的文件

  3. 点击移动到工作区按钮

上传文件并添加到工作区

然后点击保存和嵌入按钮:

保存和嵌入

AnythingLLM 就会把选择的文档构建向量(嵌入),存储到向量数据库中。

顺便提一句,AnythingLLM 也支持一些连接器,比如 Github 仓库。

AnythingLLM 对连接器的支持

文档嵌入成功之后,我们打开工作区的设置,查看「向量数据库」页签,可以看到「向量数量」发生了变化。

查看嵌入成功的向量数量

系统提示语

为了更好的生成答案,我们确认把聊天模式设置为「查询」,不然 LLM 回答的问题大概率和你自家的系统无关。

然后我们设置「聊天提示词」,这个根据你的需要定制,可以参考之前写的标准答案。我这里简答定制下:

你是WMS厂商的资深售前顾问,请根据上下文来回答客户关于我们产品的问题。   不仅要回答是否满足,还要回答我们如何实现的,以及有什么优势。   以如下格式来回答。      满足。我们的产品采用....

更好的RAG:工作区聊天设置

验证

为了方便起见,我们直接在系统提示词里面指定了回答产品问题,所以直接讲调研表的内容粘贴进来即可:

Anything LLM RAG 的结果

基本像模像样,

文档的重要性再次强调一下,文档的重要,RAG 不是凭空而来的,而且企业核心问题是不能出错, 而不是小作文写的多好。所以严格依赖文档知识,以及对结果必要的检查, 同时对文档进行升级是一个必不可少而且极其重要的步骤。大模型能不能「越用越好」的重点就在这里。

大模型的选择

对于本文提到的这类 RAG 问题,我觉得 7B 大小左右的大模型就足够胜任了,而且对个人电脑比较友好, 太大的一般电脑可能跑不起来了,太小的可能效果不太好(不过 7B 左右已经是PC端最小的模型了,2B 的模型一般是针对移动设备等场景的)。

我一般选用国产的模型(比如 GLM4、Qwen2、Baichuan2等), 因为国外模型(Llama3、Gemma、Phi等)训练资料库中文占比不大, 而且小尺寸也决定了其双语、多语能力不会十分出色,使用的时候会有奇奇怪怪的问题。

下一步

好了,今天就到这里。没有写一句代码,就是点点鼠标,就完成了基于知识库的技术调研问答。

现在已经可以针对技术问题一个个进行回答了(其实也可以多个问题也可以一起回答,是具体情况效果可能不一定特别好)。下一步我们使用 Streamlit 实现:输入 Excel 技术调研表,直接输出填写好的 Excel 文件。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值