【Datawhale-动手学大模型应用开发】大模型开发流程及架构

最新推荐文章于 2024-05-22 10:08:45 发布

BlackSheepX

最新推荐文章于 2024-05-22 10:08:45 发布

阅读量364

点赞数

文章标签：架构人工智能 langchain gpt

本文链接：https://blog.csdn.net/xujiaqi1574587/article/details/134494983

版权

大模型开发

以大语言模型为功能核心，通过大语言模型的强大理解能力和生成能力，结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。

大模型开发中，我们一般不会大幅度改动模型，而是作为一个调用工具，通过Prompt Engineering, 数据工程, 业务逻辑分解等手段来充分发挥大模型能力，适配应用任务。

大模型两个核心能力：指令理解与文本生成提供了复杂业务逻辑的简单平替方案。

传统AI开发：需要一次拆解复杂的业务逻辑，对于每个子业务训练优化模型，最后形成完整的模型链路来解决整个业务逻辑。

大模型开发：尝试用Prompt Engineering来替代子模型的训练调优，通过Prompt链路组合来实现业务逻辑，用一个通用大模型+若干业务Prompt来解决任务，从而将传统的模型训练调优转变成了更简单轻松的Prompt设计调优。

传统AI开发：构造训练集，测试集，验证集，通过在训练集训练模型，测试集调优模型，验证集上最终验证模型效果来评估性能。

大模型开发：直接从实际业务需求出发构造小批量验证集，设计合理Prompt来满足验证集效果，然后不断收集当下Prompt在业务逻辑中的Bad Case，并将其加入验证集，针对性优化Prompt，最后实现较好的泛化效果。

大模型开发流程

项目过程：加载本地文档 -> 读取文本 -> 文本分割 -> 文本向量化 -> question向量化 -> 匹配question向量匹配topk ->匹配出的文本作为上下文和问题一起添加到Prompt -> 提交给LLM生成回答
知识库助手项目流程

对于项目的解析较为简单，跟着接下来的教程继续编写即可

关注