深入解析Semantic Kernel中的聊天历史记录对象

AI_Xie_Edge

已于 2025-05-05 18:50:04 修改

阅读量1k

点赞数 13

分类专栏： Semantic Kernel C# 文章标签： microsoft Semantic Kernel .netcore

于 2025-05-05 18:49:09 首次发布

本文链接：https://blog.csdn.net/qq_40600379/article/details/147720001

版权

C# 同时被 2 个专栏收录

17 篇文章

订阅专栏

Semantic Kernel

6 篇文章

订阅专栏

文章目录

深入解析Semantic Kernel中的聊天历史记录对象

深入解析Semantic Kernel中的聊天历史记录对象

一、引言

你有没有遇到过刚跟AI说过"我喜欢吃披萨"，下一秒问"我喜欢吃什么？"，AI开始问口味偏好。这背后其实是AI缺乏【短期记忆】的困扰。今天我们分享的【聊天历史记录】，就是给AI装上【记忆芯片】的关键技术。

聊天历史记录对象是Semantic Kernel中用于维护聊天会话中消息记录的核心组件。它主要用于存储来自不同作者的消息，例如用户、AI助手、工具或系统消息。作为发送和接收消息的主要机制，聊天历史记录对象对于维护对话上下文和连续性至关重要。

在持续的对话过程中，聊天记录能够帮助AI模型更好地理解当前交互的上下文，提供更加相关和个性化的响应。此外，聊天记录还可以用于调试、分析用户行为模式以及改进AI模型性能。

二、聊天历史记录对象

2.1 创建聊天历史记录对象

聊天历史记录对象是后台列表，便于创建和添加消息。可存储于数据库中按不同用户进行历史聊天记录动态获取。

using Microsoft.SemanticKernel.ChatCompletion;

// Create a chat history object
ChatHistory chatHistory = [];

//添加系统消息
chatHistory.AddSystemMessage("你是一个乐于助人的AI助手。");
chatHistory.AddUserMessage("我喜欢吃披萨、听歌");
chatHistory.AddAssistantMessage("听起来你的兴趣爱好很 Lifestyle 噢！披萨是一种非常受欢迎的食物，无论是经典的意式披萨还是各种美式变种，它们都有着独特的风味。你有没有什么特别喜欢的披萨口味呢？另外，听歌也是一种很好的放松方式，可以提升心情，增加乐趣。你有特别喜欢的歌手或音乐类型吗？如果有，不妨分享一下，我们也可以交流一下。");
chatHistory.AddUserMessage("我喜欢什么？");

2.2 消息类型

2.2.1 用户消息（User Message）

代表用户输入内容，如同聊天软件中你发送的消息：

history.AddAssistantMessage("听起来你的兴趣爱好很 Lifestyle 噢！披萨是一种非常受欢迎的食物，无论是经典的意式披萨还是各种美式变种，它们都有着独特的风味。你有没有什么特别喜欢的披萨口味呢？另外，听歌也是一种很好的放松方式，可以提升心情，增加乐趣。你有特别喜欢的歌手或音乐类型吗？如果有，不妨分享一下，我们也可以交流一下。");

2.2.2 助手消息（Assistant Message）

记录AI的回复：

history.AddUserMessage("我喜欢吃披萨、听歌");

2.2.3 系统消息（System Message）

给AI的"角色设定卡"，控制AI的行为模式：

history.AddSystemMessage("你是一个乐于助人的AI助手。");

2.3 为什么减少聊天历史记录？

管理聊天历史记录对于维护上下文感知对话至关重要，同时确保高效性能。随着对话的进行，历史记录对象可能会超出模型上下文窗口的限制，从而影响响应质量并降低处理速度。减少聊天历史记录的结构化方法可确保最相关的信息仍然可用，而无需不必要的开销。

性能优化：大型聊天历史记录会增加处理时间。减小其大小有助于保持快速高效的交互。
上下文窗口管理：语言模型具有固定的上下文长度（如8K、128K）。当历史记录超过此限制时，旧消息将丢失。管理聊天历史记录可确保最重要的上下文保持可访问性。
内存效率：在受资源约束的环境（如移动应用程序或嵌入式系统）中，无限制的聊天历史记录可能会导致内存使用率过高和性能降低。
隐私和安全：保留不必要的对话历史记录会增加公开敏感信息的风险。结构化缩减过程可最大程度地减少数据保留期，同时维护相关上下文。

2.4 减少聊天历史记录的策略

可以使用多种方法来保持聊天历史记录可管理，同时保留基本信息：

截断：当历史记录超过预定义限制时，将删除最早的消息，确保仅保留最近的交互。
摘要：较旧的消息压缩为摘要，同时保留关键详细信息，同时减少存储的消息数。
基于token长度：基于token长度是通过测量token总数并在超出限制时删除或汇总旧消息，确保聊天历史记录保持在模型的token长度限制范围内。

聊天历史记录化简器通过评估历史记录的大小并根据可配置参数（要保留的消息数）和阈值计数（触发减少点）来自动执行这些策略。
通过集成这些减少技术，聊天应用程序可以保持响应性和性能，而不会影响聊天上下文。
在Semantic Kernel中，聊天历史记录化简器抽象由 IChatHistoryReducer 接口定义：

[Experimental("SKEXP0001")]
public interface IChatHistoryReducer
{
    Task<IEnumerable<ChatMessageContent>?> ReduceAsync(IReadOnlyList<ChatMessageContent> chatHistory, CancellationToken cancellationToken = default);
}

此接口允许自定义实现来减少聊天历史记录。

此外，语义内核还提供内置化简器：

ChatHistoryTruncationReducer - 将聊天历史记录截断为指定大小并丢弃已删除的消息。
当聊天历史记录长度超过限制时，将触发减少。
ChatHistorySummarizationReducer -
截断聊天历史记录，汇总已删除的消息，并将摘要添加回聊天历史记录作为单个消息。

这两个化简器始终保留系统消息，以保留模型的基本上下文。

三、实战

注：调用方式可参考使用 Semantic Kernel 快速对接国产大模型实战指南（DeepSeek/Qwen/GLM）

var modelConfig = Global.CurModelContext("glm-4-flash");
// 1. 填充OpenAI格式LLM调用参数值
var modelId = modelConfig.Model;
var endpoint = modelConfig.EndpointKey;
var apiKey = modelConfig.ApiKey;

// 2. 创建一个OpenAI聊天完成的内核
var builder = Kernel.CreateBuilder()
    .AddOpenAIChatCompletion(modelId,
    new Uri(endpoint),
    apiKey);

// 4.构建内核
Kernel kernel = builder.Build();

//5. 对话功能（流式）
await StartStreamingChatSession(kernel);

 /// <summary>
 /// 统一对话管理（流式输出）
 /// </summary>
 /// <param name="kernel"></param>
 /// <returns></returns>
 private async Task StartStreamingChatSession(Kernel kernel)
 {
	// 保留系统消息和最新5条对话信息（注：可以通过调整targetCount来设置保留历史记录数量）
	var reducer = new ChatHistoryTruncationReducer(targetCount: 6); 

     var chatService = kernel.GetRequiredService<IChatCompletionService>();
     var history = new ChatHistory();
     history.AddSystemMessage("你是一个乐于助人的AI助手。");

     while (true)
     {
         ///获取用户输入
         Console.Write("用户 > ");
         var input = Console.ReadLine();

         //将用户输入添加到历史记录
         history.AddUserMessage(input);

         // 以下示例演示如何在维护聊天流时仅保留最后两条用户消息。
         //注：也可使用传统方式，对历史进行截断。如history.RemoveRange(0, history.Count - 5);
         var reducedMessages = await reducer.ReduceAsync(history);
         // 保留系统消息和最新的两条用户信息
         if (reducedMessages is not null)
         {
             history = new ChatHistory(reducedMessages);
         }

         //获取流式响应
         var response = chatService.GetStreamingChatMessageContentsAsync(
             chatHistory: history,
             kernel: kernel
         );
         Console.WriteLine($"助手 > ");
         string resStr = "";
         //输出流式响应
         await foreach (var chunk in response)
         {

             resStr += chunk;//拼接聊天记录
             Console.Write(chunk);
         }
         //将完整的响应添加到历史记录
         history.AddAssistantMessage(resStr);
         //输出换行
         Console.WriteLine();
     }
 }