- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 Windows上部署Hermes-Agent
摘要:Windows环境下Hermes-Agent的部署与使用指南 本文详细介绍了如何在Windows系统上部署和使用Hermes-Agent。首先通过源码分析,确认Windows环境下主要存在终端/PTY/信号语义差异,但通过WSL2和兼容性处理仍可运行。接着提供详细的环境安装步骤,包括conda环境激活、Hermes安装和Node环境准备。重点说明了模型配置方法,推荐通过config.yaml进行管理。文章还验证了CLI和TUI两种运行方式,并针对Web前端开发提供了解决方案,包括API Server配
2026-04-20 22:53:02
808
原创 大模型强制结构化输出指南(Instructor + LiteLLM/LangChain/LangGraph)
结构化输出方案对比 本文对比了三种实现大模型结构化输出的技术方案: Instructor + LiteLLM:通过Schema注入、解析校验、失败重试的闭环,强制输出指定JSON结构。LiteLLM提供统一接口,Instructor负责结构化约束。 LangChain:提供两种实现方式: with_structured_output直接返回Pydantic对象 OutputFixingParser自动修复解析失败的情况 LangGraph:将结构化输出用于图路由决策,适合复杂工作流场景。通过定义状态节点和条
2026-04-14 22:42:13
586
原创 AI查询处理系统(Query改写技术)
模块化设计:每个组件职责单一、边界清晰,便于单独优化和灵活扩展LLM + 检索双引擎:将生成式模型的深度理解与检索系统的广度覆盖相结合,取长补短HyDE技术落地:通过“生成-检索”的创新模式,有效解决传统检索的语义鸿沟问题智能并行调度:基于依赖图的拓扑排序与并行执行,将复杂查询的响应时间从线性优化为对数级别生产级稳定性:缓存、重试、超时、降级四位一体,保障系统高可用本文介绍了一套基于LLM的智能查询处理系统,从底层原理出发,解析了查询分解与依赖图、HyDE检索增强、多路并行执行等核心技术。
2026-03-22 17:39:15
438
原创 linux系统使用vllm搭建本地模型详细教程
在 Linux 系统上使用 vLLM 搭建本地模型服务,是当前生产环境中非常主流的方案。相比于 Ollama,vLLM 通过 PagedAttention 等技术,在高并发场景下的吞吐量和显存管理上表现更优。以下是一份完整的实战指南,帮助你从零开始搭建。
2026-03-22 17:17:32
744
Qt+assimp+OpenGL进行三维模型解析和显示
2022-01-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅