运维 + AI，你得先搞懂这些-CSDN博客

本文链接：https://blog.csdn.net/n9ecommunity/article/details/141068310

很感谢夜莺提供如此优质的平台能和行业内顶尖技术大佬做面对面的交流，在这个会议中又学习到了很多有趣有深度的内容，给我在未来探索的道路上提供了一些新的指引方向。同时感谢夜莺社区的邀请，在此再做一次关于AI方面的交流文章，由于目前我也是在AI这条赛道上的探索者，如果有不专业的地方还希望各位手下留情，同时希望能结识更多的同行，一起在AI这条赛道上做一些更高级更有趣的事情。

在会议现场，我分享了 Zenlayer 在 AI 方向的一些实践效果，有些基础知识、选型思考等，并未在大会现场展开，这里我会在这篇文章中进行一些补充，希望能够给大家带来一些启发。更多的是提供一种思路和需要了解的实现背景的逻辑，而不是给出固定化的实现方式，也是希望能够有更多活跃思考。

构建AI化需要的知识体系

Semantic Kernel

Semantic Kernel是Microsoft推出的一个开源框架，旨在帮助开发者构建和部署AI应用，特别是那些需要理解和生成自然语言的应用。它提供了一种结构化的方式来定义和管理技能（Skills），这些技能可以是简单的函数调用，也可以是复杂的AI模型交互。

核心组件

Kernel: Semantic Kernel的核心，负责技能的管理和执行。
Skills: 定义了应用可以执行的一系列操作，可以是本地函数，也可以是远程服务调用。
Prompt Templates: 用于生成和修改自然语言的模板，支持变量和函数调用。
Memory: 提供了存储和检索应用状态的能力，可以是简单的键值对，也可以是复杂的图数据库。

LangChain

LangChain是一个开源框架，专注于构建应用，这些应用可以利用大型语言模型（LLMs）来执行各种任务，如回答问题、生成文本、执行代码等。它提供了一种灵活的方式来组合和调用不同的LLMs，以及管理与这些模型的交互。

核心组件

Chains: 定义了模型调用的逻辑流程，可以是简单的单步调用，也可以是复杂的多步流程。
Prompts: 用于指导模型生成特定类型输出的模板。
Memory: 提供了存储和检索应用状态的能力，可以用于上下文理解和历史记录。
Agents: 可以自动执行任务的实体，基于给定的目标和约束。

总结

Semantic Kernel和LangChain都是为了简化AI应用的开发，但它们的侧重点不同。Semantic Kernel更注重技能的定义和管理，而LangChain则更侧重于大型语言模型的组合和调用。选择哪个框架取决于具体的应用场景和需求。

在我们的场景里我们更多的是考虑使用semantic kernel的方式来构建，不是说langchain不好，只是langchain的代码侧抽象的东西太厉害，本身架构也比较重，对于后期开发的运维和迭代成本比较高，我们现在的体量还太小，感觉自身玩不太动。

大模型的应用架构

典型的业务架构

技术架构

纯Prompt

就像和一个人对话，你说一句，ta回一句，你再说一句，ta再回一句

agent + FC (Function calling)

Agent：AI 主动提要求
Function Calling：AI 要求执行某个函数

场景举例：你问过年去哪玩，ta 先反问你有几天假

RAG(Baseline)= Embeddings + 向量数据库

Embeddings：把文字转换为更易于相似度计算的编码。这种编码叫向量
向量数据库：把向量存起来，方便查找
向量搜索：根据输入向量，找到最相似的向量
场景举例：考试时，看到一道题，到书上找相关内容，再结合题目组成答案。然后，就都忘了

目前我们还使用了rerank model对RAG的结果进行重排序，使得得到更精准的答案

Fine-Tuning

努力学习考试内容，长期记住，活学活用

目前传统的FT对于在运维体系中，特别是抽象对象的训练达不到一个很好的效果，所以我们也在尝试基于DeepKe的抽象方式做运维体系中的数据，文本做FT，看是不是能把抽象的对象直接关系能理解清楚

Prompt的工程:提升LLM理解与响应能力

Prompt设计原则

为什么要说Prompt，其实有了架构，但如何让LLM理解你的推理依据，那就需要Prompt提示工程来解决，不同的LLM的chat_template的模版也是完全不同的，也就会导致不同的模型你用同一种Prompt的方式无法得到一样的答案，甚至于同一个模型多次重复同一个问题也会存在差异的现象。

从我的个人实践来说，总结主要有以下几条原则：

Write clear instructions（写出清晰的指令）
Provide reference text（提供参考文本）
Split complex tasks into simpler subtasks（将复杂的任务拆分为更简单的子任务）
Give the model time to “think”（给模型时间“思考”）
Use external tools（使用外部工具）
Test changes systematically（系统地测试变更）

具体实现的方式

1.把话说详细

尽量多的提供任何重要的详细信息和上下文，说白了，就是把话说明白一点，不要一个太笼统。比如：不要说：“总结会议记录” 而是说：“用一个段落总结会议记录。然后写下演讲者的 Markdown 列表以及他们的每个要点。最后，列出发言人建议的后续步骤或行动项目（如果有）。”

2.让模型充当某个角色

你可以把大模型想象成一个演员，你要告诉他让他演什么角色，他就会更专业更明确，一个道理。比如：充当一个喜欢讲笑话的喜剧演员，每当我请求帮助写一些东西时，你会回复一份文档，其中每个段落至少包含一个笑话或有趣的评论。

3.使用分隔符清楚地指示输入的不同部分

三引号、XML 标签、节标题等分隔符可以帮助划分要区别对待的文本节。可以帮助大模型更好的理解文本内容。我最喜欢用"““把内容框起来。比如：用50个字符总结由三引号分隔的文本。“““在此插入文字”””

4.指定完成任务所需的步骤

有些任务能拆就拆，最好指定为一系列步骤。明确地写出这些步骤可以使模型更容易去实现它们。比如：使用以下分步说明来响应用户输入。步骤1 - 用户将为您提供三引号中的文本。用一个句子总结这段文字，并加上前缀“Summary:”。步骤2 - 将步骤1中的摘要翻译成西班牙语，并添加前缀“翻译：”。

5.提供例子

也就是经典的少样本提示，few-shot prompt，先扔给大模型例子，让大模型按你的例子来输出。比如：按这句话的风格来写XX文章：“““落霞与孤鹜齐飞，秋水共长天一色。渔舟唱晚，响穷彭蠡之滨”””

6.指定所输出长度

可以要求模型生成给定目标长度的输出。目标输出长度可以根据单词、句子、段落、要点等的计数来指定。中文效果不明显，同时你给定的长度只是个大概，多少个字这种肯定会不精准，但是像多少段这种效果就比较好。比如：用两个段落、100个字符概括由三引号分隔的文本。“““在此插入文字”””

提示框架应用

是不是遵循着一套方式就可以一路梭了呢，显然不是，对于不同的任务背景其实还需要使用不同的提示词框架来做具体任务的实现，由于涉及到具体内容太过冗长，我这里也就直接给出有哪些框架和实现的框架逻辑

TAG框架

任务（Task）：描述您所要求完成的具体任务。
行动（Action）：细致描述所需采取的动作。
目标（Goal）：明确您追求的最终目的。

SPAR框架

情境（Scenario）：勾勒出背景蓝图。
问题（Problem）：阐释所面临的难题。
行动（Action）：详细说明所需实施的策略。
结果（Result）：描绘期待的成果。

TRACE框架

任务（Task）：确定并明确具体的任务。
请求（Request）：表述所希望请求的具体事项。
行动（Action）：描述必须实施的行动。
背景（Context）：提供相关背景或情境。
示例（Example）：用实例来阐明您的见解。

SCOPE框架

情境（Scenario）：描写当前状况或情景。
复杂情况（Complications）：讨论任何潜在的复杂因素。
目标（Objective）：描述预期的目标。
计划（Plan）：阐述实现目标所需的策略。
评估（Evaluation）：讲述如何评估成功的标准。

APE框架

行动（Action）：说明所完成的具体工作内容。
目的（Purpose）：讲解行动背后的意图或目标。
期望（Expectation）：阐明所期待的结果或成功的标准。

SAGE框架

情况（Situation）：描述背景或当前情况。
行动（Action）：详细说明所需进行的行动。
目标（Goal）：明确目标所在。
预期（Expectation）：阐明您所期望获得的结果。

RTF框架

角色（Role）：定义LLM的角色定位。
任务（Task）：详述特定的任务内容。
格式（Format）：说明您所期望的答案形式。

ROSES模型

角色（Role）：界定GPT所扮演的角色。
目标（Objective）：明确您的意图。
情境（Scenario）：描述具体情境与环境。
解决方案（Solution）：设定所期望的结果。
步骤（Steps）：咨询解决问题的具体步骤。

CARE框架

背景（Context）：界定讨论的场景或上下文环境。
行动（Action）：说明期望完成的行动。
结果（Result）：阐明期待的结果。
示例（Example）：提供一个例证以阐述您的观点

以上不同的提示框架对于具体实际的应用场景中需要灵活的去实现，天下没有一招鲜的武功，要用好大模型提升助力，底层的逻辑实现与框架的了解是必不可少的，否则LLM只是一个聊天工具，并不能为你的工作带来质的提升

让LLM理解逻辑推理：从CoT到ReAct

上面几个KeyPoint解释了在LLM中实现应用的主要的技术或者方式，但真正要让LLM作为一个AGENT或者Copilot存在，还需要有一个关键的点，那就是如何让LLM知道你的推理方式，其实LLM解决只是技术差距的问题，但它无法解决提出问题的源头，所以其实在LLM的今天，对于大家来说有想法且逻辑清楚的人，有了LLM的加持可能真的会一飞冲天，如果你能提出好的问题，那么就能得到一个好的答案。

那么推理架构有具体哪些呢，我在这里只说一些相对用的比较多的，特别是在运维运营场景中比较容易落地的方式。