- 博客(934)
- 资源 (2)
- 收藏
- 关注
原创 Spring AI Alibaba 1.x 系列【76】上下文工程(Context Engineering)
构建 Agent 的难点在于使其足够可靠。虽然写一个 Demo 很容易,但要在生产环境中稳定运行并不简单。
2026-06-10 15:48:51
69
原创 Spring AI Alibaba 1.x 系列【75】分布式智能体
随着智能体应用的广泛落地,智能体间的分布式部署与远程通信成为关键问题。Google 推出的 Agent-to-Agent(A2A)协议 专门解决这一问题。
2026-06-10 15:29:48
75
原创 Spring AI Alibaba 1.x 系列【74】Agentic RAG 与混合 RAG
Agentic RAG 将检索增强生成与基于 Agent 的推理相结合。Agent 不是在生成之前固定检索文档,而是逐步推理并自主决定在交互过程中何时以及如何检索信息。
2026-06-10 15:22:08
171
原创 Spring AI Alibaba 1.x 系列【73】两步 RAG
检索增强生成(Retrieval-Augmented Generation,RAG) 通过在查询时获取相关的外部知识来解决这些问题:使用特定上下文信息来增强 LLM 的回答。
2026-06-10 15:19:37
100
原创 Spring AI Alibaba 1.x 系列【72】集成 MCP 客户端
本项目演示两种在 Spring AI Alibaba 中集成 MCP(Model Context Protocol) 工具的方式
2026-06-10 14:29:30
118
原创 Spring AI Alibaba 1.x 系列【71】子图(Subgraphs)使用指南
子图(Subgraphs)是可作为普通节点嵌入到另一张图中的独立图结构。Spring AI Alibaba Graph 提供多种子图使用模式,不同模式决定父子图是否共享上下文状态,是实现 AI 工作流模块化、多智能体编排的核心能力。
2026-06-10 11:47:39
151
原创 Spring AI 1.x 系列【60】构建高效 AI Agent
如果说单个 LLM 调用是"一问一答",那么 Agent 就是让 LLM 成为"能自己动手的助手"——它不再只是回答问题,而是可以规划步骤、调用工具、反思结果、循环迭代,直到完成目标任务。
2026-06-10 11:27:04
281
原创 Spring AI 1.x 系列【59】容器化开发支持:Docker Compose 与 Testcontainers
在开发 Spring AI 应用时,经常需要连接各种外部服务 —— 模型服务(如 Ollama)、向量数据库(如 Chroma、Qdrant、Weaviate、Milvus、OpenSearch)、MCP 网关等。手动安装和配置这些服务既繁琐又容易出错。
2026-06-10 11:25:39
149
原创 Spring AI 1.x 系列【58】提示词工程(Prompt Engineering)
简单来说:LLM 就像一位知识渊博但需要精确指令的助手 —— 你如何提问,直接决定了它能给你多好的答案。同样的模型,不同的提示词写法,效果可能天差地别。这条规律几乎适用于所有 LLM 应用场景:分类、摘要、翻译、问答、代码生成、创意写作……
2026-06-09 20:46:50
86
原创 Spring AI 1.x 系列【57】动态工具发现:Tool Search Tool
随着AI Agent接入越来越多的服务(SlackGitHubJiraMCP Server),工具库规模快速膨胀——典型的多服务器场景可轻松超过50个工具,不仅消耗大量Token,模型在30+个相似工具面前的选型准确率也显著下降。方案实现34%~64% 的 Token 节省,同时支持数百工具的按需动态发现。是Anthropic首创的工具发现模式:不再将所有工具定义一次性发送给模型,而是让模型按需检索。最初只提供一个"搜索工具",模型需要时调用它查询能力,由后台将匹配的工具定义动态注入上下文。优势说明。
2026-06-09 17:38:35
269
原创 Spring AI 1.x 系列【56】用大模型评判大模型:递归顾问实现自动化评估方案
大模型自评判本质上是一种评测手段:由一个大模型去打分、判定其他模型(或自身)生成内容的优劣。它不再单纯依赖人工标注员或传统自动化指标,而是指定一个评判大模型,依据预设标准对回复进行打分、分类或优劣对比。
2026-06-09 17:32:24
298
原创 Spring AI 1.x 系列【55】AI 应用评估测试
大模型度量、评测没有标准答案。既然没有标准答案,意味着成本最高,也成为落地的瓶颈。AI 领域常提的"品味",本质上就是如何做评估的问题。
2026-06-09 16:55:45
261
原创 Spring AI 1.x 系列【54】Retry 机制分析
Spring AI 的 Retry 机制是一个两层架构,负责处理 AI API 调用失败时的自动重试策略。
2026-06-09 13:34:58
301
原创 Spring AI 1.x 系列【53】多模态能力
UserMessage 的 content 字段主要用于文本输入,而可选的 media 字段允许添加一个或多个不同模态的附加内容(图像、音频、视频)。MimeType 用于指定模态类型。根据所使用的 LLM,Media 的 data 字段可以是原始媒体内容的 Resource 对象,也可以是指向该内容的 URI。
2026-06-09 11:35:58
163
原创 Spring AI 1.x 系列【52】可观测集成 SkyWalking
本文档从零开始,在一个 Spring Boot + Spring AI 项目中实现完整的可观测性体系——将 Tracing(链路追踪)、Metrics(指标)、Logging(日志)通过 OpenTelemetry 协议统一导出到 Apache SkyWalking。
2026-06-09 08:46:37
291
原创 Spring AI 1.x 系列【51】可观测性技术选型
两套方案均可通过 OpenTelemetry(OTel)统一采集遥测数据。Spring AI 基于 Micrometer Observation 的 Tracing、Metrics、Logging 机制,天然对接 OTel 协议,无需关注后端实际选用哪套存储方案——埋点一次,后端可切换。
2026-06-08 11:26:36
35
原创 Spring AI 1.x 系列【50】可观测性:接入 Prometheus + Grafana
Prometheus + Grafana 是云原生标准监控可视化组合,Prometheus 负责指标采集、存储、告警,Grafana 负责图表展示、大盘、统一视图,广泛用于 Java/Spring 服务、AI 应用、容器、向量库、中间件监控。
2026-06-08 11:01:52
220
原创 Spring AI 1.x 系列【49】可观测性体系:从 ZhiPuAiChatModel 看 ChatModel 观测机制
Spring AI 的可观测性体系基于 Micrometer Observation 实现,为所有 ChatModel 提供统一的 Tracing、Metrics、Logging 能力。ZhiPuAiChatModel 作为 ChatModel 接口的实现类,无需编写任何可观测性专属代码,只需遵循 Spring AI 定义的标准模板即可自动获得完整的可观测性。
2026-06-08 10:49:03
353
原创 Spring AI 1.x 系列【48】可观测性(Observability)快速入门
Spring AI 基于 Spring 生态自带的可观测能力,实现 AI 全链路运行数据采集,帮助开发者洞察各类 AI 业务执行细节。
2026-06-08 10:30:25
233
原创 Spring AI 1.x 系列【47】 MCP Annotations 模块
Spring AI MCP Annotations 模块为 MCP 服务端和客户端提供了基于注解的方法处理能力。通过简洁、声明式的 Java 注解方式,简化了 MCP 服务端方法和客户端处理器的创建与注册。
2026-06-08 09:43:58
174
原创 Spring AI 1.x 系列【46】MCP Security 模块
Spring AI MCP Security 模块为 Spring AI 的模型上下文协议(MCP)实现提供了全面的 OAuth 2.0 和 API Key 安全支持。该社区驱动的项目使开发者能够使用行业标准的认证与授权机制来保护 MCP 服务端和客户端。
2026-06-08 09:43:30
199
原创 Spring AI 1.x 系列【45】无状态流式 HTTP 类型 MCP 服务端
无状态(Stateless)Streamable-HTTP MCP 服务端专为简化部署而设计,请求之间不维护会话状态,非常适合微服务架构和云原生部署场景。
2026-06-08 09:42:02
143
原创 Spring AI 1.x 系列【44】流式 HTTP 类型 MCP 服务端
Streamable HTTP 传输允许 MCP 服务端作为独立进程运行,通过 HTTP POST/GET 请求处理多个客户端连接,并可选的 SSE(Server-Sent Events)流式推送多条服务端消息。该协议已取代传统的 SSE 传输。
2026-06-08 09:41:34
263
原创 Spring AI 1.x 系列【43】基于标准输入输出 (STDIO) 与服务端推送事件 (SSE) 的 MCP 服务端
STDIO 和 SSE MCP 服务端支持多种传输机制,每种机制对应专用的启动器。使用 STDIO 客户端或 SSE 客户端即可连接对应的服务端。
2026-06-08 09:40:35
207
原创 Spring AI 1.x 系列【42】MCP 服务端 Spring Boot 启动器
Spring AI MCP Server Boot Starter 为 Spring Boot 应用提供了 MCP 服务端自动配置能力,可无缝集成 MCP 服务端功能与 Spring Boot 自动配置体系。
2026-06-08 09:39:08
209
原创 Spring AI 1.x 系列【41】接入高德 MCP 服务
本项目演示如何用 Spring AI 框架,将 DeepSeek 大模型与高德地图 MCP Server 集成,实现一个自然语言调用地图服务的后端应用。
2026-06-07 20:58:19
241
原创 Spring AI 1.x 系列【40】MCP 客户端 Spring Boot 启动器
Spring AI 提供的模型上下文协议(MCP)客户端 Spring Boot 启动器,可为 Spring Boot 应用自动配置 MCP 客户端能力。该组件同时支持同步、异步客户端实现,并兼容多种通信传输方式。
2026-06-07 20:35:56
418
1
原创 Spring AI 1.x 系列【39】MCP Java SDK 与 Spring AI 集成
MCP Java SDK 是模型上下文协议的 Java 语言实现,依托同步、异步两种通信模式,实现 AI 模型与工具之间的标准化交互。
2026-06-07 19:39:21
221
原创 Spring AI 1.x 系列【38】模型上下文协议(MCP)
模型上下文协议(Model Context Protocol,MCP)是一种开放协议,可实现大语言模型(LLM)应用与外部数据源和工具之间的无缝集成。借鉴了语言服务器协议(LSP) 的设计思想,LSP 标准化了如何在整个开发工具生态系统中添加编程语言支持。类似地,MCP 标准化了如何将额外上下文和工具集成到 AI 应用生态系统中。
2026-06-06 09:47:45
330
原创 Spring AI 1.x 系列【37】RAG 知识库平台案例:知识库管理
本 Demo 演示了一种通用的 Provider → Model 两级模型管理思路:将 AI 供应商的凭证(API Key、Endpoint)与具体模型(model_id、类型)分离管理,运行时通过工厂模式动态构建实例。
2026-06-06 09:43:51
235
原创 Spring AI 1.x 系列【36】RAG 知识库平台案例:模型管理
本 Demo 演示了一种通用的 Provider → Model 两级模型管理思路:将 AI 供应商的凭证(API Key、Endpoint)与具体模型(model_id、类型)分离管理,运行时通过工厂模式动态构建实例。
2026-06-06 09:43:11
223
原创 Spring AI 1.x 系列【35】RAG 知识库平台案例:功能介绍 & 开发环境搭建
本平台是一个基于 Spring AI + RAG (检索增强生成) 技术的知识库管理系统。用户可以将文档上传至知识库,系统自动对文档进行解析、分块、向量化,并在对话时检索相关知识片段,结合大语言模型生成更准确的回答。
2026-06-06 09:42:39
193
原创 Spring AI 1.x 系列【34】ETL 三大核心组件:DocumentReader、DocumentTransformer、DocumentWriter
ETL(抽取、转换、加载)框架是 RAG(检索增强生成)场景下数据处理的核心底座。流水线负责编排从原始数据源到结构化vector store(向量存储)的全流程,确保数据格式最优,适配 AI 模型的检索调用。
2026-05-31 22:27:46
148
原创 Spring AI 1.x 系列【33】RAG Advisor 组件与四大分层架构
Spring AI 认为,从宏观架构来看,RAG 是一套标准的 ETL(抽取、转换、加载) 流水线,而向量数据库正是 RAG 技术中检索环节的核心载体。
2026-05-31 14:32:50
325
原创 Spring AI 1.x 系列【32】检索增强生成
检索增强生成(Retrieval-Augmented Generation,RAG)通过引用外部知识库的信息来生成答案或内容,具有较强的可解释性和定制能力,适用于问答系统、文档生成、智能助手等多个自然语言处理任务中。
2026-05-31 14:28:16
306
原创 Spring AI Alibaba 1.x 系列【70】思考模式
思考模式下,模型先输出中间推理过程,再给出答案,在 Spring AI Alibaba 中如何实现深度思考、输出思考内容呢?
2026-05-31 12:04:33
190
原创 Spring AI Alibaba 1.x 系列【69】Token 用量统计
在智能体流式对话场景中,实时输出文本内容的同时,统计输入Token、输出Token、总 Token 消耗量是计费、限流、用量监控的核心需求。
2026-05-31 12:01:31
432
原创 Spring AI Alibaba 1.x 系列【68】Graph SSE 流式输出
ReactAgent 是开箱即用的 ReAct 智能体,它只有大模型和工具两个节点,需要进行流式输出的只有大模型节点,我们直接从 StreamingOutput 中获取对应类型的消息对象,就能轻松实现流式输出。
2026-05-31 11:58:58
413
原创 Spring AI Alibaba 1.x 系列【67】ReactAgent SSE 流式输出
Server-Sent Events 简称 SSE(服务器发送事件),是一种基于 HTTP 协议,客户端只连一次,服务端持续单向推送数据到前端的实时通信技术。
2026-05-31 11:56:48
378
原创 Spring AI Alibaba 1.x 系列【66】Graph 长期记忆
长期记忆不是简单的聊天记录,而是结构化的事实与上下文摘要存储,能够在不同会话间持久化,并影响智能体在未来对话中的行为。
2026-05-30 10:00:02
730
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅