自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 通用NL2SQL Agent为什么不行?我们踩了Ollama、Tool Calling、Prompt爆炸的坑后,终于落地了“通用底座+垂直SPI“架构(附核心实现代码)

本文记录了一个NL2SQL系统从"通用Agent"理想到"垂直领域底座"现实的完整演进过程。经历了API选型错误(/api/generate vs /api/chat)、Tool Calling幻觉、Prompt爆炸、三层缓存架构设计、RAG调优等一系列技术坑,最终通过"通用底座+行业SPI扩展"架构找到平衡点。**包含Ollama Tool Calling真实调用代码、三层缓存实现、SQL评分算法等可运行代码片段**。文章深入分析了通用Agent的技术边界,以及为何"适度约束"反而能提升系统可用性

2026-04-27 21:03:27 359

原创 通义灵码反思纪实之P0架构错误--附DS,豆包评论

《ReAct Agent架构问题分析与改进》 报告揭示了ReAct Agent架构存在核心设计错误:误用Ollama API构建了"伪Agent"系统。主要问题包括错误使用/api/generate端点而非/api/chat,通过Prompt工程模拟工具调用而非原生支持,导致系统依赖复杂的正则解析和模糊匹配机制。这种实现方式带来30%的失败率、额外性能开销和300行不必要的代码。改进后采用原生Tool Calling架构,使工具调用成功率从70%提升至100%,代码量减少60%,同时消除

2026-04-19 16:58:27 335

原创 从“伪 Agent“到“真 Agent“:一行 API 切换带来的架构革命

本文记录了一次真实的 ReAct Agent 重构经历。通过修正一个被忽视的 API 选择错误(`/api/generate` → `/api/chat`),将工具调用成功率从 70% 提升至 100%,代码量减少 63%,响应延迟降低 62.5%。文章提供完整的代码示例和可复用的最佳实践,帮助开发者避开 LLM Agent 开发中的核心陷阱。

2026-04-19 16:12:42 585

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除