行走的时光-CSDN博客

原创通用NL2SQL Agent为什么不行？我们踩了Ollama、Tool Calling、Prompt爆炸的坑后，终于落地了“通用底座+垂直SPI“架构（附核心实现代码）

本文记录了一个NL2SQL系统从"通用Agent"理想到"垂直领域底座"现实的完整演进过程。经历了API选型错误（/api/generate vs /api/chat）、Tool Calling幻觉、Prompt爆炸、三层缓存架构设计、RAG调优等一系列技术坑，最终通过"通用底座+行业SPI扩展"架构找到平衡点。**包含Ollama Tool Calling真实调用代码、三层缓存实现、SQL评分算法等可运行代码片段**。文章深入分析了通用Agent的技术边界，以及为何"适度约束"反而能提升系统可用性

2026-04-27 21:03:27 359

原创通义灵码反思纪实之P0架构错误--附DS,豆包评论

《ReAct Agent架构问题分析与改进》报告揭示了ReAct Agent架构存在核心设计错误：误用Ollama API构建了"伪Agent"系统。主要问题包括错误使用/api/generate端点而非/api/chat，通过Prompt工程模拟工具调用而非原生支持，导致系统依赖复杂的正则解析和模糊匹配机制。这种实现方式带来30%的失败率、额外性能开销和300行不必要的代码。改进后采用原生Tool Calling架构，使工具调用成功率从70%提升至100%，代码量减少60%，同时消除

2026-04-19 16:58:27 335

原创从“伪 Agent“到“真 Agent“：一行 API 切换带来的架构革命

本文记录了一次真实的 ReAct Agent 重构经历。通过修正一个被忽视的 API 选择错误（`/api/generate` → `/api/chat`），将工具调用成功率从 70% 提升至 100%，代码量减少 63%，响应延迟降低 62.5%。文章提供完整的代码示例和可复用的最佳实践，帮助开发者避开 LLM Agent 开发中的核心陷阱。

2026-04-19 16:12:42 585

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 通用NL2SQL Agent为什么不行？我们踩了Ollama、Tool Calling、Prompt爆炸的坑后，终于落地了“通用底座+垂直SPI“架构（附核心实现代码）

原创 通义灵码反思纪实之P0架构错误--附DS,豆包评论

原创 从“伪 Agent“到“真 Agent“：一行 API 切换带来的架构革命

空空如也

空空如也

原创通用NL2SQL Agent为什么不行？我们踩了Ollama、Tool Calling、Prompt爆炸的坑后，终于落地了“通用底座+垂直SPI“架构（附核心实现代码）

原创通义灵码反思纪实之P0架构错误--附DS,豆包评论

原创从“伪 Agent“到“真 Agent“：一行 API 切换带来的架构革命