成富-CSDN博客

原创 MCP 协议 2025-11-25 版本新功能：任务、url 模式 Elicitation、取样时的工具调用和认证机制

在服务器的认证方面，为了方便客户端发现服务器的认证机制，MCP 协议之前仅提供了对 OAuth 2.0 Authorization Server Metadata 的支持。生成的结果，经过用户的审核之后，发送回服务器，完成整个取样的流程。在之前的协议版本中，服务器发送的 elicit 请求中，包含了期望客户端提供的数据的格式。第一种是动态客户端注册，使用的是 OAuth 2.0 Dynamic Client Registration Protocol，这也是早期版本的 MCP 规范中支持的注册机制。

2025-12-12 13:42:19 540

原创 Chat Agent UI，类似 ChatGPT 的聊天界面，Spring AI 应用的测试工具

目前的很多 AI 应用，提供的是类似 ChatGPT 的聊天机器人界面。在后端 API 的开发过程中，能够进行测试是非常重要的。不管是流式还是非流式，REST API 的请求类型是 ChatAgentRequest，返回值类型是 Flux<ServerSentEvent<ChatAgentResponse>>。考虑到大部分聊天机器人在界面上都是相似的，我开发了一个独立的界面，可以直接与 API 交互。它的功能是为 AI 应用的后端程序提供一个简易的测试界面，对 Spring AI 提供了更简单的集成方式。

2025-12-08 12:41:08 671

原创 Toon，面向 Token 的对象表示，比 JSON 更节省 Token 的数据编码格式

如果输入的 token 数量过大，不仅可能遇到模型的上下文窗口的上限，还可能由于提示中的内容过多，反而影响大模型的输出质量。在下面的测试中，输入的查询是“居住在新西兰的用户的名字”，与用户的数据一同发送给大模型。在发送给大模型的提示中，除了自然语言的指令之外，占据大头是其中的结构化数据，表示需要由模型来处理的输入数据。数组中包含的元素的类型通常是相同的，具有相似的结构。如果希望大模型产生结构化的输出，可以在提示中描述 Toon 的格式，并要求大模型给出 Toon 格式的输出，再使用类库解析即可。

2025-12-02 15:27:35 512

原创链式工作流（Chain Workflow）【智能体开始模式】

内部的第一个 agent.execute 表示的是生成初始的文章的智能体的执行。第二个 agent.execute 表示的是优化文章内容的链条的执行过程。该链条内部有 3 个智能体的执行，分别对应于链条中的 3 个步骤。使用链式工作流的一个示例是优化文章内容的质量。最后一个智能体的输出是最终的任务执行结果。第一个步骤的输入是原始的任务输入。最后一个步骤的输出是整个任务的输出。每个步骤使用上一个步骤的输出作为该步骤的输入。下面是这些步骤使用的提升文章质量的建议。最后一个步骤产生的文章是任务的最终输出。

2025-11-25 18:46:56 230

原创路由工作流（Routing Workflow）【智能体开发模式】

使用路由工作流模式的一个示例是，为客户服务的查询选择最合适的子系统。所有目标路由的信息，加上原始的任务输入，被发送给大模型，由大模型来进行选择。任务输入被传递给目标路由所对应的智能体来执行，该智能体的输出作为原始任务的输出。在最简单的情况下，目标路由的名称和描述是必须的。该模式的实现中包含了一个路由任务和一系列的目标任务。选择路由目标的逻辑，通常使用大模型来实现，也可以基于某些规则来实现路由的选择。路由工作流模式，对于一个任务的输入，从一个候选智能体的列表中选择最合适的目标，把任务的输入转发给该智能体。

2025-11-24 18:05:25 596

原创并行工作流（Parallelization Workflow）【智能体开发模式】

这个智能体使用并行的子任务生成代码示例，每个任务负责生成一种编程语言的代码示例。sample_code 表示生成的代码示例，其值来自并行运行的子任务的结果。模式中介绍的代码生成的例子，智能体可以并行执行 3 个子任务来使用 3 个不同的模型评估代码。作为示例的智能体编写关于算法的文章。在这种情况下，在执行子任务之前，需要把原始的任务输入转换成子任务需要的类型。每个子任务负责收集不同领域的信息，最后把子任务的结果组装起来，得到最终的报告。如果所有的子任务返回相同类型的结果，它们通常使用相同类型的输入。

2025-11-23 18:24:32 620

原创 Spring AI 1.1 正式发布，新功能介绍

从实现的层次来说，CallAdvisorChain 中新增了一个新的方法 copy，其作用是复制当前 CallAdvisorChain 中，从指定的 CallAdvisor 之后的其余 CallAdvisor，返回一个仅包含这些 CallAdvisor 的新链条。Advisor 是 Spring AI 中的一个重要功能，可以对发送给大模型的请求和大模型的响应进行处理。这次版本升级包含的内容比较多，这里进行一下具体的介绍。新的模型，包括不同服务提供商推出的新模型，比如 OpenAI 的 GPT-5 系列等。

2025-11-22 18:29:12 763

原创【Java 25】紧凑对象头，减少内存消耗，提升性能

已经有很多的试验可以证明，启用紧凑对象头可以提升应用的性能，包括减少 heap 的使用，减少 CPU 时间，和减少 GC 的次数。从 Java 24 开始，紧凑对象头这个功能在生产环境上得到了验证，证明了该功能的稳定性，也确实可以提升系统的性能。类指针的压缩必须被启用，并且压缩之后的类指针的尺寸从 32 比特减少到 22 比特。紧凑对象头（Compact Object Headers）使得 JVM 中对象头的大小，从目前的 96 或 128 比特，减少到在 64 位平台上的 64 比特。

2025-11-19 17:14:33 303

原创【Java 25】实例 main 方法和紧凑源代码，极简 Hello World 程序

在之前的 Java 版本中，入口类的 main 方法的声明必须是 public static void main(String[] args)。如果是非 static 的实例 main 方法，则要求入口类有一个非私有的，不带任何参数的构造方法。这个简单的程序中，其实所包含的元素很多，包括 public，static，还有 main 方法的 String[] 参数，以及 System.out 的使用。作为一个入门的程序，其中的复杂度还是太高了，包含了很多不必要的概念。里面包含了最少的元素，适合于初学者。

2025-10-21 14:21:49 256

原创【Java 25】Class-File API，解析、生成和转换 Java 字节码的标准 API

比如构建类的 ClassBuilder，构建方法的 MethodBuilder，和构建字段的 FieldBuilder 等。比如，表示类的 ClassModel，表示方法的 MethodModel，和表示字段的 FieldModel 等。在 Java 相关的开发中，对字节码（byte code）的操作，一直以来被认为是比较高级的技巧。在下面的代码中，对于方法中的调用指令，检查所调用方法的所有者，是否为 OldService。在下面的代码中，被解析的是当前的 Java 类的字节码，输出全部方法的名称。

2025-10-15 16:38:42 403

原创【Java 25】稳定值（Stable Value）

首次调用该 Supplier 的 get 方法时，会调用所封装的 Supplier 的 get 方法来产生值，并设置到 StableValue 中。在这些新的内容中，我个人认为最实用的是 Stable Value（稳定值），因为 Stable Value 解决了一个开发中由来已久的问题，那就是如何延迟设置不可变的值。多次调用 stable 方法返回的 Supplier 的 get 方法，会发现只输出一条消息到控制台，表明被封装的 Supplier 的 get 方法，只被调用了一次。这可以提升系统的性能。

2025-10-13 17:21:49 349

原创 MCP 工具，2025-06-18 版本的更新

该工具的 annotations 的声明如下，其中 readOnlyHint 的值是 true，destructiveHint 的值是 false，idempotentHint 的值是 true，openWorldHint 的值是 false。为了保证向后兼容性，如果工具的调用结果中包含了结构化的内容，也同时应该把 JSON 对象序列化之后的 JSON 文本包含在 content 中。提到 MCP 中的工具，最被大家熟悉的是工具的三要素，分别是工具的名称、描述和输入参数的schema。

2025-09-01 19:08:06 382

原创服务器推送事件（Server-sent Events，SSE），大模型流式输出与 MCP

比如，如果大模型的响应中，包含了调用自定义函数的名称和参数。这就要求响应的处理方，缓存已经接收到的部分参数值，聚合成完整的参数值之后，再进行实际的函数调用。SSE 最大的优势在于，构建在已有的 HTTP 基础设施之上，实现和维护的成本低，学习的成本也低。随着 AI 大模型和 MCP 相关开发的流行，服务器推送事件（Server-sent Events，SSE），这个相对小众的技术又一次出现在大家的面前。随着应用的发展，产生了服务器主动发送数据给客户端的需求，比如，最典型的场景是服务器主动推送通知给客户端。

2025-08-27 19:00:41 986

原创大模型的工具调用与 MCP

在获取到大模型的响应之后，从响应中提取到要调用的函数名称和输入参数，同样根据函数名称找到对应的 ToolCallback 对象，调用 ToolCallback 的 call 方法完成函数的调用，把得到的调用结果发送回大模型。对于大模型的响应中包含的函数调用的信息，根据函数名称，使用 MCP 客户端把调用请求发送给提供该工具的 MCP 服务器，并获取调用结果。工具是从大模型的角度来的。作为大模型的使用者，我们既可以直接使用模型内置的工具，也可以提供自定义的函数定义，由大模型推导出调用函数的实际参数值。

2025-08-24 17:13:41 392

原创 DeepSeek V3.1 发布

其他的推理模型，比如 OpenAI 的 GPT-5 和 o3，以及 Anthropic 的 Claude，都支持函数调用。如果使用 DeepSeek 的 API，可以使用的模型仍然是 deepseek-chat 和 deepseek-reasoner。deepseek-chat 对应的是 DeepSeek V3.1 的非思考模式，deepseek-reasoner 对应的则是思考模式。在严格模式下，模型的输出会严格遵守函数的输入参数的 JSON Schema 的要求。

2025-08-22 20:05:42 418

原创 MCP 传输方式，stdio、HTTP SSE 和 Streamable HTTP

POST 请求的内容可以是单个 JSON-RPC 的请求、通知或响应，或多个请求或通知组成的数组，或多个响应组成的数组。如果 POST 请求的内容中包含了任意数量的JSON-RPC 请求，服务器可以返回一个SSE流，或是 JSON 格式的响应。HTTP 传输方式增加了服务器的部署难度，但是对客户端来说简化了很多，只需要一个连接服务器的 URL 即可，服务器可以部署在云端。客户端控制服务器的生命周期。stdio 传输方式最大的优势是可以访问用户的本地环境，尤其是用户的私有文件，适合于个人使用的场景。

2025-08-20 19:22:15 535

原创 MCP 网关，MCP 服务器的集中式管理

Docker MCP 网关使用的是简单的聚合策略。使用了 MCP 网关之后，应用的 MCP 客户端连接到 MCP 网关，MCP 网关连接到实际的 MCP 服务器。网关可以提供 MCP 服务器的集中管理，包括 MCP 服务器的添加和删除，工具的过滤，服务器和工具的权限控制等。客户端所连接的是一个虚拟的 MCP 服务器，该服务器所包含的提示模板，资源和工具，由网关从多个MCP服务器聚合而来。网关可以采用不同的聚合策略，既可以简单地聚合全部 MCP 服务器的工具，也可以根据用户的权限来控制工具的可见性。

2025-08-19 16:36:24 710

原创《MCP Java 开发实战》课程介绍

一个 Java 开发的 AI 应用，集成了 Java MCP客户端之后，可以使用 JavaScript 或 Python 编写的 MCP 服务器中的外挂知识。这一部分介绍了 4 个相对完整的实战项目，分别是文件系统MCP服务器，文本转SQL的MCP服务器，实现了检索增强生成的MCP服务器，以及一个通用的MCP测试客户端。由于 MCP 的重要性，现在的 AI 应用开发，离不开对 MCP 的了解。通过这五个部分的介绍，可以对 MCP 有完整的了解，从而学会如何开发自己的 MCP 服务器和客户端。

2025-08-18 20:38:38 316

原创 MCP（Model Context Protocol）是什么？

MCP Java 开发实战》是本人录制的付费课程，对 MCP 开发进行了详细的介绍，包括 MCP 协议的细节，MCP 服务器和客户端的开发详解，提供了 3 个 MCP 服务器的实战案例，分别是文件系统 MCP 服务器、文本转 SQL MCP 服务器、以及实现了检索增强生成的 MCP 服务器，最后是一个集成了大模型和 MCP 客户端的测试 MCP 服务器的通用工具。就是引入一个标准的协议，把外挂知识的提供和使用划分为服务器和客户端两个角色，服务器和客户端之间使用标准的协议进行交互。文本是最基础的模态。

2025-06-30 17:49:45 515

原创评估者-优化者 (Evaluator-Optimizer) 【智能体开发模式】

与并行工作流模式共同使用时，可以执行多个并行的评估，取这些评估值的平均值，作为最终的评估结果。当达到了最大的执行次数之后，即便评估的结果是不通过，最后一次生成的结果仍然会被返回。如果评估的结果是不通过，代码可以基于评估的反馈进行优化。评估者-优化者模式通过评估者的反馈来优化前一次生成的结果，从而提高最终生成结果的质量。如果评估不通过，feedback 中包含的是评估者的反馈。生成了初始的结果之后，可以对生成的代码进行评估。优化之后的代码会被再次评估，直到通过评估，或者达到了最大的评估次数。

2025-04-06 16:11:55 1063

原创任务执行模式【智能体开发模式】

在执行任务时，智能体会准备这些变量的值，填充到模板之后，得到实际的提示内容。任务执行是最特殊的模式。推理模型很强大，但是任务执行智能体所执行的任务，应该是简单和直接的。这里介绍的任务执行模式是狭义上的概念，也是最小的任务单元。任务在执行时，发送请求给大模型，以大模型的结构化输出作为任务的执行结果。模板中对生成的用户进行了清晰的限制，给出了 User 中的每个字段的要求。实际上，现在的大模型的能力很强，可以执行很复杂的任务。如果预期的大模型输出有相对固定的长度，可以设置大模型的输出 token 的数量上限。

2025-04-01 16:40:39 861

空空如也

空空如也