闵浮龙-CSDN博客

原创 Java 后端转 AI 应用开发，我发现真正的机会不在算法，而在落地

AI 不会简单淘汰后端程序员，但会淘汰一部分只会写重复 CRUD、拒绝升级的人。未来更有竞争力的后端，不只是会写接口的人，而是能把业务系统、大模型、知识库、工具调用、工作流整合起来的人。算法当然重要，但对普通 Java 后端来说，切入 AI 的第一站不是训练模型，而是做 AI 应用落地。你真正要抓住的是：业务理解、系统架构、RAG、Agent、工具调用、工作流、工程化、上线能力。

2026-05-21 19:47:02 75

原创从用户一句话到任务完成：Hermes Agent 一次请求完整链路详解

当对话超过模型上下文一定比例时，Hermes 会触发压缩。压缩前会先把 Memory 刷盘，防止重要事实丢失；然后把中间对话总结成更短的摘要，同时保留最近 N 条消息和工具调用/工具结果成对结构。第一，从“平台消息”转换成“标准任务”：入口层和会话层负责识别来源、用户、平台、历史上下文。第二，从“自然语言”转换成“可执行循环”：Prompt Builder 把身份、记忆、技能、项目规则和工具说明装进模型上下文，AIAgent 再通过模型调用和工具调用循环推进任务。

2026-05-21 18:19:24 145

原创 Hermes Agent 和普通 Chatbot 的区别是什么？

普通 Chatbot 解决的是“怎么把话说好”；Hermes Agent 解决的是“怎么把事情做完，并且越做越懂你”。普通 Chatbot 的能力边界主要在文本生成；Hermes 的能力边界扩展到了工具调用、项目上下文、持久记忆、技能沉淀、跨平台会话、定时自动化、安全隔离和外部系统接入。一句话总结：Hermes Agent 不是更花哨的聊天机器人，而是一个把大模型放进工程运行时里的长期任务代理。它代表的方向，是 AI 从“会回答”走向“能执行、能积累、能协作、能安全落地”。

2026-05-21 13:43:50 84

原创 Hermes Agent 安全边界全解析：让 AI Agent 敢执行、可控制、能回滚

安全系统不能只考虑“拦住”，还要考虑“拦不住时如何恢复”。Hermes 的 Checkpoints 与 /rollback 机制，就是为文件修改和破坏性操作准备的恢复通道。官方文档说明，Checkpoints 可以在 write_file、patch、rm、rmdir、cp、install、mv、sed -i、truncate、dd、shred、输出重定向、git reset/clean/checkout 等操作前自动拍快照。

2026-05-21 12:42:14 83

原创 Hermes Agent 深度解析：压缩、Fallback 和预算控制

Hermes 官方文档中的摘要模板不是简单写一句“前面聊了很多”，而是结构化记录：用户目标、约束和偏好、已完成工作、正在进行的工作、阻塞点、关键决策、相关文件、下一步、关键上下文。摘要字段作用Goal用户到底想完成什么，而不是只记聊天表面内容用户偏好、代码风格、技术约束、业务限制Progress已完成、进行中、卡住的事情重要技术决策以及原因读过、改过、创建过的文件Next Steps下一轮应该继续做什么错误信息、配置值、关键路径等不能丢的细节。

2026-05-21 10:02:42 176

原创 Hermes Agent Sessions 架构详解：AI 如何跨平台延续任务、找回历史、持续推进工作

Hermes Agent 的 Sessions 机制，表面看是在保存聊天历史，实质上是在构建长期 Agent 的任务状态层。它把多平台入口、Agent Loop、工具调用、历史检索、上下文压缩、跨平台交接、成本统计和运维管理连接在一起。最重要的结论有三点：第一，Session 不是聊天记录，而是任务轨迹；第二，History 不等于 Context，历史要完整保存，但推理时只注入必要内容；第三，跨平台 Agent 的关键不是接多少聊天软件，而是能否让同一个任务在不同入口之间保持同一条主线。

2026-05-21 08:29:31 215

原创 Hermes Agent Skills 架构深度解析：AI Agent 为什么能把经验沉淀成能力？

Hermes Agent 的 Skills 系统，真正有价值的地方不在于多了几个命令，而在于它提供了一种工程化的经验沉淀方式：把成功流程写成 Skill，把踩坑经验补进 Pitfalls，把验证方法写进 Verification，把团队规范变成可复用流程。从架构角度看，Skills 是 Agent 的“流程记忆”。Memory 让 Agent 记住事实，Tools 让 Agent 能执行动作，MCP 让 Agent 能接入外部系统，而 Skills 让 Agent 在这些能力之上形成稳定的工作方法。

2026-05-20 22:13:37 251

原创 Hermes Agent Memory 记忆系统详解：为什么它能“越用越懂你”？

Hermes Agent 的 Memory 机制，不是魔法，也不是每次在线训练模型。它真正做的是把长期有效的信息资产化、分层存储、按需注入、持续整理。它用 MEMORY.md 记住环境、项目、工具和经验。它用 USER.md 记住用户偏好、沟通风格和工作习惯。它用 Session Search 找回过去具体聊过什么。它用外部 Memory Provider 扩展语义搜索、知识图谱和用户建模。它用容量管理和安全扫描防止 Memory 变成垃圾堆或攻击入口。

2026-05-20 17:44:11 290

原创一文看懂 Hermes Agent 的 MCP 架构：外部工具到底怎么接入 AI Agent？

Hermes Agent 的 MCP 设计，真正有价值的地方不是“多了一个配置项”，而是把外部工具接入变成了一套标准工程流程：配置连接、启动发现、命名注册、工具过滤、模型调用、运行时执行、结果回填、安全控制、动态刷新、并发扩展、Sampling 反向推理、反向暴露 Hermes 能力。MCP 是 Hermes Agent 连接真实世界的标准插槽。没有 MCP，Agent 的工具生态容易碎片化；有了 MCP，企业系统、开发工具、数据库、消息平台、SaaS 服务都可以通过统一方式接入 Agent。

2026-05-20 13:58:34 228

原创 Hermes Agent Tools 架构深度解析

Hermes Agent 的 Tools 不是简单的工具列表，而是一套完整的可控行动系统。它让模型不再只是生成文字，而是能围绕任务一步步搜索、读取、修改、执行、记忆、委派和自动化。从工程角度看，Hermes Tools 最值得学习的是这条主线：工具先注册到 Registry，再由 Toolsets 控制可见范围，模型只看到过滤后的 schema；

2026-05-20 10:01:00 382

原创 Hermes Agent Context 架构详解：AI Agent 为什么能“知道当前项目”？

Hermes Agent 之所以能“知道当前项目”，靠的不是神秘能力，而是 Context 工程。它把项目规则、身份风格、长期记忆、用户画像、技能经验、手动引用、工具结果、会话历史这些信息分门别类，再按合适的时机注入到模型上下文中。真正值得学习的不是某一个文件名，而是背后的架构思想：项目规则要沉淀成文件，而不是每次口头重复。长期事实要放 Memory，流程经验要做 Skills。当前任务材料要用 @引用或工具精准获取。系统提示词要保持稳定，临时上下文不要污染长期状态。

2026-05-20 07:46:11 437

原创 Hermes Agent Agent Loop 深度解析：一次任务到底是怎么执行的？

Hermes Agent 的 Agent Loop 可以浓缩成一句话：把用户任务变成一轮又一轮的“上下文整理、模型决策、工具执行、结果回填、状态保存”。模型负责判断下一步，工具负责真实行动，Session 负责记住过程，Memory 和 Skills 负责沉淀长期经验，压缩、预算、Fallback 和安全机制负责让系统稳定可控。所以学习 Hermes Agent，不要只问“它用了什么模型”，更要问“它如何组织一次任务”。

2026-05-19 22:38:36 129

原创 Hermes Agent 整体架构详解：AI Agent、Memory、Skills、MCP、工具调用、自我改进闭环全解析

Hermes Agent 最值得学习的地方，不是某个炫酷命令，而是它把 AI Agent 做成了一个完整工程系统。这个系统有入口、有上下文、有模型路由、有工具、有记忆、有技能、有会话、有自动化、有安全、有部署后端。AI Agent = 模型能力 + Harness 工程能力模型决定“能不能理解任务”，Harness 决定“能不能可靠执行任务”。Hermes Agent 的整体架构，正好展示了一个长期运行 Agent 需要具备哪些工程能力：要有统一入口，让不同平台的任务进入同一个运行时；

2026-05-19 21:31:11 165

原创 Docker 面试题详解：容器、镜像、Dockerfile、网络、Volume、Compose、安全与生产实践一次讲透

Docker 的核心，不只是会敲 docker run，也不是只会写一个 Dockerfile。真正重要的是理解镜像、容器、网络、存储、安全和编排背后的设计思想。镜像解决“交付一致性”，容器解决“运行隔离性”，Volume 解决“数据持久性”，Network 解决“服务通信”，Compose 解决“多容器管理”，安全与资源限制解决“生产可控性”。把这些串起来，Docker 才不是零散命令，而是一套完整的工程交付体系。对面试来说，最稳的回答方式是：先讲概念，再讲原理，再讲生产落地和排障。

2026-05-19 17:40:11 196

原创 Spring Cloud 面试题深度解析：微服务架构、注册中心、配置中心、Gateway、OpenFeign、负载均衡、熔断降级全攻略

如果把整篇文章浓缩成一句话，那就是：Spring Cloud 是一套围绕微服务治理的工具体系，它帮我们解决服务拆分之后的配置、发现、路由、调用、负载均衡、熔断、消息、监控和运维问题。真正理解 Spring Cloud，不是背出一堆组件名字，而是能讲清这些组件分别解决什么问题，它们在一次请求链路中的位置是什么，以及上线后如何通过超时、重试、熔断、限流、灰度、监控、链路追踪等手段保障系统稳定。

2026-05-19 16:19:58 431

原创 Spring Boot 面试题详解：Spring Boot 核心原理、自动配置、启动流程、IoC 容器、Web 请求链路、事务、Actuator 与 JVM 线上排障全攻略

Spring Boot 的核心价值，是把 Spring 应用从“能写”推进到“更快开发、更易配置、更容易上线、更方便监控”。它通过 Starter 降低依赖管理成本，通过自动配置降低配置成本，通过内嵌容器降低部署成本，通过外部化配置适配多环境，通过 Actuator 提升生产可观测性。面试时，不要把 Spring Boot 讲成一堆注解。更好的方式是围绕一条主线：应用如何启动、Bean 如何创建、自动配置如何生效、Web 请求如何流转、配置如何管理、事务如何控制、上线如何监控、故障如何排查。

2026-05-19 15:34:45 283

原创 Java JVM 面试题详解：JVM运行原理、内存模型、堆栈方法区、GC垃圾回收、JIT编译、类加载机制与线上调优全攻略

JVM 判断对象是否可回收，常用的是可达性分析。它从一组根对象出发，沿着引用链往下找，能被找到的对象就是“还活着”，找不到的对象就可能被回收。常见 GC Roots 包括栈帧中的局部变量引用、静态变量引用、常量引用、JNI 引用等。用人话说，只要一个对象还能从正在运行的线程、类静态变量或底层引用里绕着找到，它就不能随便回收。JVM 是 Java 后端绕不开的基础。它负责把 class 字节码加载进来，划分运行时内存，解释或编译执行字节码，并通过 GC 管理对象生命周期。

2026-05-19 13:15:05 261

原创面试题详解：大模型模型加速全攻略——KV Cache、量化、连续批处理、Speculative Decoding、TensorRT-LLM 与 vLLM 一次讲透

大模型加速不是单一技术，而是一套从模型到业务的系统工程。Prefill 慢，就优化上下文、Prefix Cache、Chunked Prefill 和 FlashAttention；Decode 慢，就优化 KV Cache、PagedAttention、连续批处理、量化和投机解码；显存不够，就做量化、KV Cache 压缩、Offload 或并行；吞吐不够，就看调度、批处理、数据并行和缓存；成本太高，就做模型路由、蒸馏和业务降级。

2026-05-19 11:26:01 611

原创 MySQL 面试题爆款详解：InnoDB 页机制、B+树索引、Buffer Pool、Redo Log、页分裂与性能优化一次讲透

在 InnoDB 里，数据不会孤零零地散落在磁盘上，而是被组织成一个个页。常见默认情况下，一个 InnoDB 索引页大小是 16KB；页大小由 innodb_page_size 在实例初始化时决定。这个页里可能存多条行记录，也会有页头、页目录、空闲空间、校验等管理信息。这就像你去仓库找一件货物，不是让你直接在地上找某个小零件，而是先找到某个货箱，再在货箱里找。InnoDB 的页就是这个货箱。答：页是 InnoDB 管理数据和索引的基本单位。

2026-05-19 09:41:58 544

原创面试题详解：大模型设计沙箱全攻略——LLM Sandbox、Agent 工具执行、代码沙箱、安全隔离、权限控制与工程落地

大模型沙箱不是为了让模型更自由，而是为了让模型安全地执行。它让 Agent 可以写代码、跑脚本、处理文件、访问工具，同时通过隔离、权限、资源、网络、密钥和审计，把风险控制在可接受范围内。真正成熟的沙箱设计，不是“我用了容器”，而是能讲清楚：模型怎么发起工具调用，应用层怎么校验，沙箱怎么创建，权限怎么限制，执行结果怎么过滤，日志怎么审计，失败后怎么回收和降级。面试时只要抓住一句话就够了：大模型沙箱的核心，是让模型能动手，但不能乱动手。

2026-05-19 08:21:23 407

原创 Dify 面试题详解：开源 LLM 应用开发平台、RAG 知识库、Workflow 工作流、Agent 智能体一文讲透

如果把整篇文章压缩成一句话：Dify 的价值不是让你少写几个 Prompt，而是让你更快、更系统地把大模型能力变成一个可发布、可维护、可迭代的应用。它把模型、知识库、Workflow、Agent、工具、API、日志和观测整合到一起，特别适合企业知识库、智能客服、流程自动化和内部助手。但也要清楚，平台降低的是搭建门槛，不会自动替你解决数据质量、权限治理、评估闭环和系统稳定性。真正成熟的 Dify 项目，仍然需要用工程思维去设计、验证、上线和持续迭代。

2026-05-18 22:47:19 50

原创面试题详解：Semantic Kernel 全面解析——微软 AI 编排 SDK、Agent 架构、Plugin 插件、Function Calling、RAG 与企业级落地

如果把整篇文章浓缩成一句话，那就是：Semantic Kernel 不是单纯的模型调用 SDK，而是一个面向企业 AI 应用的编排中间层。它把模型、提示词、插件、函数、记忆、Agent、Workflow 和业务代码组织在一起，让大模型真正能进入企业业务流程。它最适合解决的问题，不是让模型多说几句话，而是让模型在安全可控的边界内调用工具、检索知识、执行任务、形成闭环。

2026-05-18 20:38:30 107

原创面试题详解：AutoGen 多智能体框架全攻略——AgentChat、Core、Tool Calling、GroupChat、MCP 与企业级 Agent 应用落地

AutoGen 代表的是一种多智能体工程思路：复杂任务不再交给一个模型一次性完成，而是拆给不同角色，通过消息、工具和流程协作完成。它适合研究、代码、数据分析、复杂客服、企业工作流等需要多步骤、多角色、多工具参与的任务。但 AutoGen 不是银弹。它带来的不仅是能力提升，也带来控制、成本、时延、安全和可观测性挑战。真正成熟的 AutoGen 应用，一定不是堆 Agent，而是清楚定义任务边界、角色分工、工具权限、终止条件和评估闭环。

2026-05-18 19:45:48 127

原创面试题详解：LlamaIndex 全栈解析——RAG 数据框架、索引检索、Query Engine、Agent Workflow 与企业级落地

如果把 LlamaIndex 压缩成一句话，那就是：它是一套把私有数据接入大模型的工程框架。它不只是帮你做向量检索，而是覆盖数据接入、解析、切片、索引、存储、检索、生成、Agent 工具化和生产治理。面试时最好的回答方式，是先讲定位：它是上下文增强 LLM 应用的数据框架；再讲流程：Reader 读数据，Document 承载原文，Node 进入索引，VectorStoreIndex 支持语义检索，Retriever 召回证据，Query Engine 生成答案；

2026-05-18 18:12:58 140

原创面试题详解：提示词工程 Prompt Engineering 全攻略——大模型提示词、RAG Prompt、Agent Prompt、Tool Calling、结构化输出与安全防护一次讲透

如果把整篇文章浓缩成一句话，那就是：提示词工程不是“会写漂亮话”，而是让模型在明确目标、可靠上下文、清晰约束和稳定格式下完成任务。个人使用大模型时，提示词可以写得灵活；企业应用大模型时，提示词必须变成模板、流程、评估和安全体系。RAG 场景要基于证据，Agent 场景要约束工具，结构化输出要能被系统解析，安全场景要防注入和越权调用。真正成熟的提示词工程，最终一定会走向“Prompt 模板化、评估自动化、日志可追踪、失败可复盘”。这也是面试里最能体现工程能力的地方。

2026-05-18 16:42:29 259

原创面试题详解：检索链路设计全攻略——RAG 检索架构、查询理解、多路召回、混合检索、Rerank、上下文构造与评估闭环

如果把整篇文章压缩成一句话，那就是：检索链路设计不是简单向量检索，而是从离线建库到在线查询的完整证据生产线。离线侧要做好解析、清洗、切分、元数据和索引；在线侧要做好查询理解、多路召回、融合重排、上下文构造、性能治理和评估闭环。好的检索链路，要做到找得全、找得准、排得对、拼得好、跑得快。只有这样，大模型才能从“凭感觉回答”变成“基于证据回答”。面试时只要围绕这条主线展开，结合 BM25、向量检索、混合检索、RRF、Rerank、上下文压缩、缓存和评估指标，就能把检索链路设计讲得非常完整。

2026-05-18 16:13:32 252

原创面试题详解：GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透

GraphRAG 不是为了炫技而建图，而是为了解决普通 RAG 在关系推理、跨文档关联和全局总结上的不足。它把文档里的实体、关系和主题社区抽出来，让系统不再只是找相似文本，而是能沿着知识结构找证据。但 GraphRAG 也不是银弹。它需要更高的建库成本、更复杂的更新机制、更严格的抽取质量控制。如果你的问题只是单点问答，普通 RAG 更简单、更便宜。如果你的业务知识关系密集、文档多、问题经常跨多份资料，那么 GraphRAG 就能显著提升系统的组织能力和回答质量。

2026-05-18 15:25:50 328

原创面试题详解：智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战

15.1 一个完整答案的主线你可以把整套系统概括为：理解层做输入清洗、意图识别和实体抽取；决策层做对话管理、槽位跟踪和策略选择；执行层负责 FAQ、RAG、GraphRAG、API、工作流和转人工；反馈层负责指标监控、错误分析和数据回流。框架层面，之所以偏向 Rasa Pro，是因为它更适合流程型客服；模型层面，之所以偏向 Qwen 和 8B，是因为它们在中文效果、部署性、时延和成本之间比较均衡；检索层面，FAQ、RAG 和 GraphRAG 并不是互相替代，而是应该按问题复杂度分层路由。

2026-05-18 13:21:41 471

原创面试题详解：多模态大模型全攻略——ViT 架构、扩散模型、U-Net、VAE、CLIP、Prompt 图像对齐一次讲透

如果把这组问题浓缩成一句话，那就是：ViT 解决图像如何进入 Transformer，CLIP 解决文本和图像如何对齐，扩散模型解决如何从噪声生成图像，U-Net 负责每一步去噪，VAE 负责降低生成成本并还原图像。面试中最能拉开差距的，不是背出一堆模型名，而是能把它们放进同一条链路里讲清楚：图像怎么编码，文本怎么条件化，噪声怎么加，模型怎么学，生成怎么反向去噪，以及当 prompt 和图像不对齐时如何定位和优化。

2026-05-18 09:29:15 317

原创面试题详解：RAG评估与RAGAS全攻略——如何评价RAG项目效果、关键指标有哪些、RAGAS是什么

4.1 可以把它理解成：面向 RAG 的自动化体检工具RAGAS 全称是 Retrieval Augmented Generation Assessment。它是一套专门面向 RAG 系统的开源评估框架，核心思想是：不要只看最终回答，而是要把“问题、检索上下文、最终回答”一起纳入评估。它之所以受欢迎，是因为很多业务团队并没有特别完整、特别严格的标准答案数据集，但他们仍然希望快速知道系统大致哪里出了问题。RAGAS 的一些指标正好适合这种场景，它能帮助团队用较低成本批量跑出自动化评估结果。

2026-05-18 07:56:52 442

原创面试题详解：高级 RAG 优化全解析——Query Transformation、混合检索、RAG Fusion、HyDE、Graph RAG 与 Rerank 一次讲透

4.1 大模型可以在召回前帮你“理解问题”大模型辅助召回，不是让大模型直接编答案，而是让它在检索之前或检索之后做辅助判断。检索之前，它可以做意图识别、查询改写、问题分解、同义词扩展、生成多查询。检索之后，它可以判断候选片段是否真的相关，做上下文压缩或重排。4.2 为什么需要大模型辅助召回？因为传统检索器更擅长“相似度匹配”，但不一定懂用户真实任务。比如用户问“这个方案能不能上线”，真正需要的可能是“风险、依赖、测试结果、审批流程、历史事故”。如果直接拿原问题去检索，可能只搜到“上线方案”四个字相关的文档。

2026-05-17 22:58:40 17

原创 RAG 面试题详解：为什么大模型需要外部知识库、RAG 工作流程、PDF 解析与文本分块全解析

7.1 固定长度切分固定长度切分最简单，按字符数或 token 数切，比如每 500 个 token 一个块，再加 50 个 token overlap。优点是实现快、稳定、容易上线；缺点是可能把标题、段落、表格、代码和语义边界切断。7.2 递归切分递归切分会先尝试按更自然的结构切，比如标题、段落、句子；如果块仍然太大，再逐级往下切。它比固定长度更尊重文本结构，是很多 RAG 系统的常见默认方案。7.3 按标题和章节切分对于手册、规范、制度文件、Markdown 文档，按标题和章节切分往往效果很好。

2026-05-17 21:24:51 123

原创面试题详解：大模型思维链 CoT 推理模型训练全解析——如何微调出带思维链的 LLM、优缺点、SFT 与 RLHF 能不能跳过

如果把整篇文章浓缩成一句话，那就是：带有思维链的推理模型，不是靠简单让模型多写几句就能得到的，而是需要高质量推理数据、冷启动 SFT、采样筛选、奖励或偏好优化、评估治理共同配合。SFT 的价值，是把模型拉到一个稳定、可控、可优化的输出分布；RLHF 或 RL 的价值，是在此基础上进一步提升推理质量、偏好对齐和安全性。跳过 SFT 并非绝对不可能，但大多数真实业务场景中，先 SFT 再 RLHF 仍然是更稳妥、更可控的路线。

2026-05-17 20:20:25 141

原创面试题详解：RLHF、PPO、DPO、Reward Model、on-policy/off-policy 全解析——大模型对齐训练高频面试题一次讲透

这组题的主线其实很清楚：人类偏好先变成 chosen/rejected 或 reward 信号，然后模型通过 PPO 或 DPO 等方式把这种偏好吸收到参数里。PPO 是传统路线，能力强但工程复杂；DPO 是更轻量的偏好优化路线，稳定省资源但更依赖数据质量。

2026-05-17 18:45:11 155

原创面试题详解：Agent 记忆管理全解析——历史对话获取、摘要记忆、事实记忆、知识图谱记忆一次讲透

4.1 摘要记忆解决的是“长会话装不下”的问题当会话越来越长时，一个自然思路就是：不是把旧对话原样保留，而是把它压缩成摘要。也就是说，把对话中最重要的目标、约束、结论、任务进度和关键事实总结出来，作为长期脉络保留。这样做的好处是非常直观的：历史对话从“原文级存储”变成了“信息级存储”。模型不再需要看到全部旧消息，但仍然能够知道这段会话之前大致发生了什么。4.2 摘要记忆的价值与风险摘要记忆很适合长会话、长期助手、复杂任务拆解这类场景。它能大幅降低 token 成本，也能帮助系统保留较长时间跨度的任务主线。

2026-05-17 16:49:58 285

原创面试题：LangChain Agent 相关全解析——大模型 Agent、AgentExecutor、创建方式、实现思路与领域知识注入

5.1 AgentExecutor 不是 Agent 本身，而是执行器AgentExecutor 可以理解成“运行 Agent 的外壳”。Agent 负责决定下一步要做什么，Tools 负责执行具体动作，而 AgentExecutor 负责循环调度、把工具结果交回模型、判断是否继续、控制最大轮数、处理异常和返回最终结果。5.2 为什么需要 AgentExecutor？如果没有执行器，模型只会告诉你“我想调用某个工具”，但不会真正形成可控的运行闭环。

2026-05-17 15:24:38 278

原创面试题：Function Call 函数调用详解——为什么需要函数调用、定义与完整流程、工具调用目的、Agent 落地与工程实践全解析

3.1 最容易理解的定义Function Call 可以理解成：开发者先把外部工具用标准格式描述给模型，模型在对话过程中根据用户意图判断是否需要使用某个工具，并输出工具名和结构化参数，最后由程序真正执行工具，再把结果交回模型。注意这里有一个非常关键的边界：模型不是直接执行函数。模型只是生成“我要调用哪个函数、参数是什么”的请求；真正的函数调用、权限校验、异常处理和结果返回，都由业务系统完成。3.2 为什么一定要强调职责边界？因为很多初学者会误以为“模型调用函数”就是模型自己运行代码。

2026-05-17 13:47:44 296

原创面试题：LangChain 基本概念详解——Components、Prompt Templates、Output Parsers、Retrieval、Agents、Toolkits、向量数据库全解析

LangChain Model 是对不同模型供应商的统一封装。它让开发者可以用相对一致的方式调用 OpenAI、Anthropic、Google、开源模型、本地模型等。常见类型包括 ChatModel、LLM 和 Embedding Model。ChatModel 面向聊天消息，通常输入 messages，输出 AIMessage；LLM 更偏传统文本补全；Embedding Model 则把文本转成向量，用于检索、聚类、相似度计算。

2026-05-17 11:18:16 483

原创面试题：SFT 数据集详解——监督微调数据格式、数据集来源、数据清洗、Temperature 温度参数与合成数据策略全解析

5.1 Temperature 是推理阶段常见的采样参数Temperature 可以理解成一个控制输出随机性的旋钮。低温度时，模型更倾向于选择概率最高的答案，输出更稳定、更保守；高温度时，概率分布会更平，更多备选答案也有机会被选中，输出会更发散、更有创造性。注意：Temperature 通常不是 SFT 数据集里的字段，而是在推理或用强模型合成数据时设置的参数。它本身不等于“训练强度”，也不等于“模型聪明程度”。5.2 低温度适合什么场景？

2026-05-17 10:18:27 314

原创面试题：PEFT-LoRA 及变种详解——LoRA 原理、矩阵初始化、作用矩阵、Rank/Alpha 选择、过拟合治理、rsLoRA/AdaLoRA/DoRA/LoRA-GA/QLoRA 全解析

10.1 QLoRA 的核心思路QLoRA 可以理解成“量化底座 + LoRA 训练”。它把预训练大模型以 4-bit 形式加载并冻结，只训练 LoRA 适配器。这样既保留了大模型能力，又显著降低了显存需求。10.2 QLoRA 为什么省显存？因为基础模型权重被量化成更低比特，并且不参与训练。训练时主要更新 LoRA 小矩阵，而不是整套大模型参数。QLoRA 还引入了 NF4、双重量化、分页优化器等技术进一步降低显存压力。10.3 QLoRA 的优缺点优点是显存占用低，能在资源有限的设备上微调更大模型；

2026-05-17 09:16:29 407

apache-tomcat-9.0.0.M18免安装包

apache-tomcat-9.0免安装包

2017-03-25

SwitchHosts免安装包

SwitchHosts用于快速修改window的hosts文件

2017-04-24

linux Redis安装步骤及安装包

2017-04-18

SQLyogEnt安装文件

SQLyogEnt

2017-04-07

nginx压缩包和安装手册

2017-04-07

Java高并发程序设计模式资料

Java高并发程序设计模式

2017-03-29

keepalived高可用

keepalived高可用linux安装包

2017-04-24

Json字符串格式化工具

2017-04-12

Java编程思想第四版完整中文高清版(免费)

2017-03-25

Foxmail_7.1.3安装文件

2017-04-07

软件项目管理资料

2017-03-24

restclient-ui-3.5开发包

restclient-ui-3.5，可以测试包括服务层中各种post，get之类的请求

2017-04-12

notepad++安装文件

2017-03-29

360截图安装文件

360截图

2017-04-07

Linux命令大全

2017-04-12

maven课程文件

maven课程

2017-03-24

单点登录文档

单点登录

2017-03-24

FileZilla_3.25.0_XiaZaiBa+vsftpd安装手册

2017-04-08

myeclipse svn插件

svn插件

2017-03-24

WebService笔记

2017-03-24

面试题总汇

JAVA面试题总汇

2017-05-11

solr的安装使用步骤

2017-05-12

SolrCloud集群搭建和使用步骤

2017-05-13

Java程序员面试宝典

《Java程序员面试宝典》主要内容简介：目前许多开发者对Java语言及其底层原理掌握不牢固，在面试过程中经常漏洞百出，无法取得好成绩。而招聘单位为了得到高素质的员工往往使出浑身解数，采用各种形式的面试考察求职者，这让面试难度大大增加。求职者要想成功应聘，不仅需要扎实的基本功，还需要经受情商和智商方面的考查。《Java程序员面试宝典》通过200个面试题，对企业招聘Java程序员需要掌握的知识进行了系统、全面的总结，以帮助读者进行充分的面试准备，在激烈的竞争中拔得头筹。《Java程序员面试宝典》列举了各大IT公司的面试真题，详细分析了应聘Java程序员职位的常见考点，主要内容包括面试流程及求职准备、Java语言基础、数据类型、集合框架、图形用户界面、输入与输出、多线程、反射机制、网络编程、JDBC、Web开发基础、SSH框架（Struts、Spring和Hibernate）、EJB、JPA、算法、设计模式及情商和智商类面试题。《Java程序员面试宝典》附带1张DVD光盘，内容为《Java程序员面试宝典》所有面试题的多媒体教学视频（共14.5小时）及免费赠送的55小时Java教学视频和5.5小时算法教学视频。授人以鱼，不如授人以渔。《Java程序员面试宝典》中的面试题不但以实例代码和流程图的形式对答案进行了详细解析，还对问题的相关知识点进行了扩展说明。希望通过《Java程序员面试宝典》，读者可以成功应聘，并提升综合素质。《Java程序员面试宝典》适合应聘Java和J2EE职位的程序员阅读，也适合其他程序员作为拓展读物进行阅读。

2017-05-03

linux jdk1.8 64位

Java Development Kit 8 for liunx简称jdk 1.8 linux版，是一款可以在linux系统上安装使用的java程序，本站提供了jdk-8u131-linux-x64.tar.gz下载地址，有需要的朋友们欢迎前来下载使用.

2017-10-31

Linux jdk1.8 32位

2017-10-31

redisclient免安装破解文件

redisclient免安装破解文件 redisclient免安装破解文件

2017-10-31

RabbitMQ-3.4.1安装文件+Spring-rabbit+RabbitMQ-3.4.1安装手册

2017-07-12

SecureCRT免安装破解文件

SecureCRT免安装破解文件 SecureCRT免安装破解文件 SecureCRT免安装破解文件

2017-10-31

基于storm实时热点统计的分布式并行缓存预热

一、基于nginx+lua完成商品详情页访问流量实时上报kafka的开发 ==================================== 在nginx这一层，接收到访问请求的时候，就把请求的流量上报发送给kafka 这样的话，storm才能去消费kafka中的实时的访问日志，然后去进行缓存热数据的统计用得技术方案非常简单，从lua脚本直接创建一个kafka producer，发送数据到kafka ``` wget https://github.com/doujiang24/lua-resty-kafka/archive/master.zip yum install -y unzip unzip lua-resty-kafka-master.zip cp -rf /usr/local/lua-resty-kafka-master/lib/resty /usr/hello/lualib nginx -s reload local cjson = require("cjson") local producer = require("resty.kafka.producer") local broker_list = { { host = "192.168.31.187", port = 9092 }, { host = "192.168.31.19", port = 9092 }, { host = "192.168.31.227", port = 9092 } } local log_json = {} log_json["headers"] = ngx.req.get_headers() log_json["uri_args"] = ngx.req.get_uri_args() log_json["body"] = ngx.req.read_body() log_json["http_version"] = ngx.req.http_version() log_json["method"] =ngx.req.get_method() log_json["raw_reader"] = ngx.req.raw_header() log_json["body_data"] = ngx.req.get_body_data() local message = cjson.encode(log_json); local productId = ngx.req.get_uri_args()["productId"] local async_producer = producer:new(broker_list, { producer_type = "async" }) local ok, err = async_producer:send("access-log", productId, message) if not ok then ngx.log(ngx.ERR, "kafka send err:", err) return end ``` 两台机器上都这样做，才能统一上报流量到kafka ``` bin/kafka-topics.sh --zookeeper 192.168.31.187:2181,192.168.31.19:2181,192.168.31.227:2181 --topic access-log --replication-factor 1 --partitions 1 --create bin/kafka-console-consumer.sh --zookeeper 192.168.31.187:2181,192.168.31.19:2181,192.168.31.227:2181 --topic access-log --from-beginning ``` （1）kafka在187上的节点死掉了，可能是虚拟机的问题，杀掉进程，重新启动一下 nohup bin/kafka-server-start.sh config/server.properties & （2）需要在nginx.conf中，http部分，加入resolver 8.8.8.8; （3）需要在kafka中加入advertised.host.name = 192.168.31.187，重启三个kafka进程（4）需要启动eshop-cache缓存服务，因为nginx中的本地缓存可能不在了二、基于storm+kafka完成商品访问次数实时统计拓扑的开发 ==============

2018-03-19

实现mysql读写分离+使用视频

2017-07-12

Linux jdk1.7 64位

jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz

2017-10-31

权限管理视频

2017-06-23

solr-4.10.3

solr-4.10.3安装包

2017-05-12

Scrum敏捷项目管理ppt

2017-04-29

mysql的yum源包

2017-04-25

各大知名企业面试题

ACM程序设计导引及在线实践程序员代码面试指南剑指offer 软件技术基础：离散数学、数据结构、C.编程实训 .来可伟.文字版 2016奇虎360C++研发工程师内推笔试题 2016奇虎360JAVA研发工程师内推笔试题阿里巴巴2015校招研发阿里巴巴2016前端开发工程师笔试二阿里巴巴2016前端开发工程师笔试一阿里巴巴2016数据挖掘工程师笔试阿里巴巴2016研发工程师笔试选择题二阿里巴巴2016研发工程师笔试选择题三阿里巴巴2016研发工程师笔试选择题四阿里巴巴2016研发工程师笔试选择题一百度2015安全研发笔试卷百度2015大数据云计算研发笔试卷百度2015前端研发笔试卷百度研发工程师2015深圳笔试卷美团2016研发工程师模拟笔试题人人网2015研发笔试卷A 人人网2015研发笔试卷E 搜狗2015JAVA工程师笔试题腾讯2016研发工程师笔试真题二腾讯2016研发工程师笔试真题三腾讯2016研发工程师笔试真题一

2018-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

apache-tomcat-9.0.0.M18免安装包

SwitchHosts免安装包

linux Redis安装步骤及安装包

SQLyogEnt安装文件

nginx压缩包和安装手册

Java高并发程序设计模式资料

keepalived高可用

Json字符串格式化工具

Java编程思想第四版完整中文高清版(免费)

Foxmail_7.1.3安装文件

软件项目管理资料

restclient-ui-3.5开发包

notepad++安装文件

360截图安装文件

Linux命令大全

maven课程文件

单点登录文档

FileZilla_3.25.0_XiaZaiBa+vsftpd安装手册

myeclipse svn插件

WebService笔记

面试题总汇

solr的安装使用步骤

SolrCloud集群搭建和使用步骤

Java程序员面试宝典

linux jdk1.8 64位

Linux jdk1.8 32位

redisclient免安装破解文件

RabbitMQ-3.4.1安装文件+Spring-rabbit+RabbitMQ-3.4.1安装手册

SecureCRT免安装破解文件

基于storm实时热点统计的分布式并行缓存预热

实现mysql读写分离+使用视频

Linux jdk1.7 64位

权限管理视频

solr-4.10.3

Scrum敏捷项目管理ppt

mysql的yum源包

各大知名企业面试题

IK分词器+tomcat-7.0.47+jdk+sol+zookeepe

Solr集群环境

zookeeper-3.4.6压缩包

空空如也