自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

闵浮龙的博客

一只忧郁的程序猿

  • 博客(562)
  • 资源 (70)
  • 收藏
  • 关注

原创 Java 后端转 AI 应用开发,我发现真正的机会不在算法,而在落地

AI 不会简单淘汰后端程序员,但会淘汰一部分只会写重复 CRUD、拒绝升级的人。未来更有竞争力的后端,不只是会写接口的人,而是能把业务系统、大模型、知识库、工具调用、工作流整合起来的人。算法当然重要,但对普通 Java 后端来说,切入 AI 的第一站不是训练模型,而是做 AI 应用落地。你真正要抓住的是:业务理解、系统架构、RAG、Agent、工具调用、工作流、工程化、上线能力。

2026-05-21 19:47:02 75

原创 从用户一句话到任务完成:Hermes Agent 一次请求完整链路详解

当对话超过模型上下文一定比例时,Hermes 会触发压缩。压缩前会先把 Memory 刷盘,防止重要事实丢失;然后把中间对话总结成更短的摘要,同时保留最近 N 条消息和工具调用/工具结果成对结构。第一,从“平台消息”转换成“标准任务”:入口层和会话层负责识别来源、用户、平台、历史上下文。第二,从“自然语言”转换成“可执行循环”:Prompt Builder 把身份、记忆、技能、项目规则和工具说明装进模型上下文,AIAgent 再通过模型调用和工具调用循环推进任务。

2026-05-21 18:19:24 145

原创 Hermes Agent 和普通 Chatbot 的区别是什么?

普通 Chatbot 解决的是“怎么把话说好”;Hermes Agent 解决的是“怎么把事情做完,并且越做越懂你”。普通 Chatbot 的能力边界主要在文本生成;Hermes 的能力边界扩展到了工具调用、项目上下文、持久记忆、技能沉淀、跨平台会话、定时自动化、安全隔离和外部系统接入。一句话总结:Hermes Agent 不是更花哨的聊天机器人,而是一个把大模型放进工程运行时里的长期任务代理。它代表的方向,是 AI 从“会回答”走向“能执行、能积累、能协作、能安全落地”。

2026-05-21 13:43:50 84

原创 Hermes Agent 安全边界全解析:让 AI Agent 敢执行、可控制、能回滚

安全系统不能只考虑“拦住”,还要考虑“拦不住时如何恢复”。Hermes 的 Checkpoints 与 /rollback 机制,就是为文件修改和破坏性操作准备的恢复通道。官方文档说明,Checkpoints 可以在 write_file、patch、rm、rmdir、cp、install、mv、sed -i、truncate、dd、shred、输出重定向、git reset/clean/checkout 等操作前自动拍快照。

2026-05-21 12:42:14 83

原创 Hermes Agent 深度解析:压缩、Fallback 和预算控制

Hermes 官方文档中的摘要模板不是简单写一句“前面聊了很多”,而是结构化记录:用户目标、约束和偏好、已完成工作、正在进行的工作、阻塞点、关键决策、相关文件、下一步、关键上下文。摘要字段作用Goal用户到底想完成什么,而不是只记聊天表面内容用户偏好、代码风格、技术约束、业务限制Progress已完成、进行中、卡住的事情重要技术决策以及原因读过、改过、创建过的文件Next Steps下一轮应该继续做什么错误信息、配置值、关键路径等不能丢的细节。

2026-05-21 10:02:42 176

原创 Hermes Agent Sessions 架构详解:AI 如何跨平台延续任务、找回历史、持续推进工作

Hermes Agent 的 Sessions 机制,表面看是在保存聊天历史,实质上是在构建长期 Agent 的任务状态层。它把多平台入口、Agent Loop、工具调用、历史检索、上下文压缩、跨平台交接、成本统计和运维管理连接在一起。最重要的结论有三点:第一,Session 不是聊天记录,而是任务轨迹;第二,History 不等于 Context,历史要完整保存,但推理时只注入必要内容;第三,跨平台 Agent 的关键不是接多少聊天软件,而是能否让同一个任务在不同入口之间保持同一条主线。

2026-05-21 08:29:31 215

原创 Hermes Agent Skills 架构深度解析:AI Agent 为什么能把经验沉淀成能力?

Hermes Agent 的 Skills 系统,真正有价值的地方不在于多了几个命令,而在于它提供了一种工程化的经验沉淀方式:把成功流程写成 Skill,把踩坑经验补进 Pitfalls,把验证方法写进 Verification,把团队规范变成可复用流程。从架构角度看,Skills 是 Agent 的“流程记忆”。Memory 让 Agent 记住事实,Tools 让 Agent 能执行动作,MCP 让 Agent 能接入外部系统,而 Skills 让 Agent 在这些能力之上形成稳定的工作方法。

2026-05-20 22:13:37 251

原创 Hermes Agent Memory 记忆系统详解:为什么它能“越用越懂你”?

Hermes Agent 的 Memory 机制,不是魔法,也不是每次在线训练模型。它真正做的是把长期有效的信息资产化、分层存储、按需注入、持续整理。它用 MEMORY.md 记住环境、项目、工具和经验。它用 USER.md 记住用户偏好、沟通风格和工作习惯。它用 Session Search 找回过去具体聊过什么。它用外部 Memory Provider 扩展语义搜索、知识图谱和用户建模。它用容量管理和安全扫描防止 Memory 变成垃圾堆或攻击入口。

2026-05-20 17:44:11 290

原创 一文看懂 Hermes Agent 的 MCP 架构:外部工具到底怎么接入 AI Agent?

Hermes Agent 的 MCP 设计,真正有价值的地方不是“多了一个配置项”,而是把外部工具接入变成了一套标准工程流程:配置连接、启动发现、命名注册、工具过滤、模型调用、运行时执行、结果回填、安全控制、动态刷新、并发扩展、Sampling 反向推理、反向暴露 Hermes 能力。MCP 是 Hermes Agent 连接真实世界的标准插槽。没有 MCP,Agent 的工具生态容易碎片化;有了 MCP,企业系统、开发工具、数据库、消息平台、SaaS 服务都可以通过统一方式接入 Agent。

2026-05-20 13:58:34 228

原创 Hermes Agent Tools 架构深度解析

Hermes Agent 的 Tools 不是简单的工具列表,而是一套完整的可控行动系统。它让模型不再只是生成文字,而是能围绕任务一步步搜索、读取、修改、执行、记忆、委派和自动化。从工程角度看,Hermes Tools 最值得学习的是这条主线:工具先注册到 Registry,再由 Toolsets 控制可见范围,模型只看到过滤后的 schema;

2026-05-20 10:01:00 382

原创 Hermes Agent Context 架构详解:AI Agent 为什么能“知道当前项目”?

Hermes Agent 之所以能“知道当前项目”,靠的不是神秘能力,而是 Context 工程。它把项目规则、身份风格、长期记忆、用户画像、技能经验、手动引用、工具结果、会话历史这些信息分门别类,再按合适的时机注入到模型上下文中。真正值得学习的不是某一个文件名,而是背后的架构思想:项目规则要沉淀成文件,而不是每次口头重复。长期事实要放 Memory,流程经验要做 Skills。当前任务材料要用 @引用或工具精准获取。系统提示词要保持稳定,临时上下文不要污染长期状态。

2026-05-20 07:46:11 437

原创 Hermes Agent Agent Loop 深度解析:一次任务到底是怎么执行的?

Hermes Agent 的 Agent Loop 可以浓缩成一句话:把用户任务变成一轮又一轮的“上下文整理、模型决策、工具执行、结果回填、状态保存”。模型负责判断下一步,工具负责真实行动,Session 负责记住过程,Memory 和 Skills 负责沉淀长期经验,压缩、预算、Fallback 和安全机制负责让系统稳定可控。所以学习 Hermes Agent,不要只问“它用了什么模型”,更要问“它如何组织一次任务”。

2026-05-19 22:38:36 129

原创 Hermes Agent 整体架构详解:AI Agent、Memory、Skills、MCP、工具调用、自我改进闭环全解析

Hermes Agent 最值得学习的地方,不是某个炫酷命令,而是它把 AI Agent 做成了一个完整工程系统。这个系统有入口、有上下文、有模型路由、有工具、有记忆、有技能、有会话、有自动化、有安全、有部署后端。AI Agent = 模型能力 + Harness 工程能力模型决定“能不能理解任务”,Harness 决定“能不能可靠执行任务”。Hermes Agent 的整体架构,正好展示了一个长期运行 Agent 需要具备哪些工程能力:要有统一入口,让不同平台的任务进入同一个运行时;

2026-05-19 21:31:11 165

原创 Docker 面试题详解:容器、镜像、Dockerfile、网络、Volume、Compose、安全与生产实践一次讲透

Docker 的核心,不只是会敲 docker run,也不是只会写一个 Dockerfile。真正重要的是理解镜像、容器、网络、存储、安全和编排背后的设计思想。镜像解决“交付一致性”,容器解决“运行隔离性”,Volume 解决“数据持久性”,Network 解决“服务通信”,Compose 解决“多容器管理”,安全与资源限制解决“生产可控性”。把这些串起来,Docker 才不是零散命令,而是一套完整的工程交付体系。对面试来说,最稳的回答方式是:先讲概念,再讲原理,再讲生产落地和排障。

2026-05-19 17:40:11 196

原创 Spring Cloud 面试题深度解析:微服务架构、注册中心、配置中心、Gateway、OpenFeign、负载均衡、熔断降级全攻略

如果把整篇文章浓缩成一句话,那就是:Spring Cloud 是一套围绕微服务治理的工具体系,它帮我们解决服务拆分之后的配置、发现、路由、调用、负载均衡、熔断、消息、监控和运维问题。真正理解 Spring Cloud,不是背出一堆组件名字,而是能讲清这些组件分别解决什么问题,它们在一次请求链路中的位置是什么,以及上线后如何通过超时、重试、熔断、限流、灰度、监控、链路追踪等手段保障系统稳定。

2026-05-19 16:19:58 431

原创 Spring Boot 面试题详解:Spring Boot 核心原理、自动配置、启动流程、IoC 容器、Web 请求链路、事务、Actuator 与 JVM 线上排障全攻略

Spring Boot 的核心价值,是把 Spring 应用从“能写”推进到“更快开发、更易配置、更容易上线、更方便监控”。它通过 Starter 降低依赖管理成本,通过自动配置降低配置成本,通过内嵌容器降低部署成本,通过外部化配置适配多环境,通过 Actuator 提升生产可观测性。面试时,不要把 Spring Boot 讲成一堆注解。更好的方式是围绕一条主线:应用如何启动、Bean 如何创建、自动配置如何生效、Web 请求如何流转、配置如何管理、事务如何控制、上线如何监控、故障如何排查。

2026-05-19 15:34:45 283

原创 Java JVM 面试题详解:JVM运行原理、内存模型、堆栈方法区、GC垃圾回收、JIT编译、类加载机制与线上调优全攻略

JVM 判断对象是否可回收,常用的是可达性分析。它从一组根对象出发,沿着引用链往下找,能被找到的对象就是“还活着”,找不到的对象就可能被回收。常见 GC Roots 包括栈帧中的局部变量引用、静态变量引用、常量引用、JNI 引用等。用人话说,只要一个对象还能从正在运行的线程、类静态变量或底层引用里绕着找到,它就不能随便回收。JVM 是 Java 后端绕不开的基础。它负责把 class 字节码加载进来,划分运行时内存,解释或编译执行字节码,并通过 GC 管理对象生命周期。

2026-05-19 13:15:05 261

原创 面试题详解:大模型模型加速全攻略——KV Cache、量化、连续批处理、Speculative Decoding、TensorRT-LLM 与 vLLM 一次讲透

大模型加速不是单一技术,而是一套从模型到业务的系统工程。Prefill 慢,就优化上下文、Prefix Cache、Chunked Prefill 和 FlashAttention;Decode 慢,就优化 KV Cache、PagedAttention、连续批处理、量化和投机解码;显存不够,就做量化、KV Cache 压缩、Offload 或并行;吞吐不够,就看调度、批处理、数据并行和缓存;成本太高,就做模型路由、蒸馏和业务降级。

2026-05-19 11:26:01 611

原创 MySQL 面试题爆款详解:InnoDB 页机制、B+树索引、Buffer Pool、Redo Log、页分裂与性能优化一次讲透

在 InnoDB 里,数据不会孤零零地散落在磁盘上,而是被组织成一个个页。常见默认情况下,一个 InnoDB 索引页大小是 16KB;页大小由 innodb_page_size 在实例初始化时决定。这个页里可能存多条行记录,也会有页头、页目录、空闲空间、校验等管理信息。这就像你去仓库找一件货物,不是让你直接在地上找某个小零件,而是先找到某个货箱,再在货箱里找。InnoDB 的页就是这个货箱。答:页是 InnoDB 管理数据和索引的基本单位。

2026-05-19 09:41:58 544

原创 面试题详解:大模型设计沙箱全攻略——LLM Sandbox、Agent 工具执行、代码沙箱、安全隔离、权限控制与工程落地

大模型沙箱不是为了让模型更自由,而是为了让模型安全地执行。它让 Agent 可以写代码、跑脚本、处理文件、访问工具,同时通过隔离、权限、资源、网络、密钥和审计,把风险控制在可接受范围内。真正成熟的沙箱设计,不是“我用了容器”,而是能讲清楚:模型怎么发起工具调用,应用层怎么校验,沙箱怎么创建,权限怎么限制,执行结果怎么过滤,日志怎么审计,失败后怎么回收和降级。面试时只要抓住一句话就够了:大模型沙箱的核心,是让模型能动手,但不能乱动手。

2026-05-19 08:21:23 407

原创 Dify 面试题详解:开源 LLM 应用开发平台、RAG 知识库、Workflow 工作流、Agent 智能体一文讲透

如果把整篇文章压缩成一句话:Dify 的价值不是让你少写几个 Prompt,而是让你更快、更系统地把大模型能力变成一个可发布、可维护、可迭代的应用。它把模型、知识库、Workflow、Agent、工具、API、日志和观测整合到一起,特别适合企业知识库、智能客服、流程自动化和内部助手。但也要清楚,平台降低的是搭建门槛,不会自动替你解决数据质量、权限治理、评估闭环和系统稳定性。真正成熟的 Dify 项目,仍然需要用工程思维去设计、验证、上线和持续迭代。

2026-05-18 22:47:19 50

原创 面试题详解:Semantic Kernel 全面解析——微软 AI 编排 SDK、Agent 架构、Plugin 插件、Function Calling、RAG 与企业级落地

如果把整篇文章浓缩成一句话,那就是:Semantic Kernel 不是单纯的模型调用 SDK,而是一个面向企业 AI 应用的编排中间层。它把模型、提示词、插件、函数、记忆、Agent、Workflow 和业务代码组织在一起,让大模型真正能进入企业业务流程。它最适合解决的问题,不是让模型多说几句话,而是让模型在安全可控的边界内调用工具、检索知识、执行任务、形成闭环。

2026-05-18 20:38:30 107

原创 面试题详解:AutoGen 多智能体框架全攻略——AgentChat、Core、Tool Calling、GroupChat、MCP 与企业级 Agent 应用落地

AutoGen 代表的是一种多智能体工程思路:复杂任务不再交给一个模型一次性完成,而是拆给不同角色,通过消息、工具和流程协作完成。它适合研究、代码、数据分析、复杂客服、企业工作流等需要多步骤、多角色、多工具参与的任务。但 AutoGen 不是银弹。它带来的不仅是能力提升,也带来控制、成本、时延、安全和可观测性挑战。真正成熟的 AutoGen 应用,一定不是堆 Agent,而是清楚定义任务边界、角色分工、工具权限、终止条件和评估闭环。

2026-05-18 19:45:48 127

原创 面试题详解:LlamaIndex 全栈解析——RAG 数据框架、索引检索、Query Engine、Agent Workflow 与企业级落地

如果把 LlamaIndex 压缩成一句话,那就是:它是一套把私有数据接入大模型的工程框架。它不只是帮你做向量检索,而是覆盖数据接入、解析、切片、索引、存储、检索、生成、Agent 工具化和生产治理。面试时最好的回答方式,是先讲定位:它是上下文增强 LLM 应用的数据框架;再讲流程:Reader 读数据,Document 承载原文,Node 进入索引,VectorStoreIndex 支持语义检索,Retriever 召回证据,Query Engine 生成答案;

2026-05-18 18:12:58 140

原创 面试题详解:提示词工程 Prompt Engineering 全攻略——大模型提示词、RAG Prompt、Agent Prompt、Tool Calling、结构化输出与安全防护一次讲透

如果把整篇文章浓缩成一句话,那就是:提示词工程不是“会写漂亮话”,而是让模型在明确目标、可靠上下文、清晰约束和稳定格式下完成任务。个人使用大模型时,提示词可以写得灵活;企业应用大模型时,提示词必须变成模板、流程、评估和安全体系。RAG 场景要基于证据,Agent 场景要约束工具,结构化输出要能被系统解析,安全场景要防注入和越权调用。真正成熟的提示词工程,最终一定会走向“Prompt 模板化、评估自动化、日志可追踪、失败可复盘”。这也是面试里最能体现工程能力的地方。

2026-05-18 16:42:29 259

原创 面试题详解:检索链路设计全攻略——RAG 检索架构、查询理解、多路召回、混合检索、Rerank、上下文构造与评估闭环

如果把整篇文章压缩成一句话,那就是:检索链路设计不是简单向量检索,而是从离线建库到在线查询的完整证据生产线。离线侧要做好解析、清洗、切分、元数据和索引;在线侧要做好查询理解、多路召回、融合重排、上下文构造、性能治理和评估闭环。好的检索链路,要做到找得全、找得准、排得对、拼得好、跑得快。只有这样,大模型才能从“凭感觉回答”变成“基于证据回答”。面试时只要围绕这条主线展开,结合 BM25、向量检索、混合检索、RRF、Rerank、上下文压缩、缓存和评估指标,就能把检索链路设计讲得非常完整。

2026-05-18 16:13:32 252

原创 面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透

GraphRAG 不是为了炫技而建图,而是为了解决普通 RAG 在关系推理、跨文档关联和全局总结上的不足。它把文档里的实体、关系和主题社区抽出来,让系统不再只是找相似文本,而是能沿着知识结构找证据。但 GraphRAG 也不是银弹。它需要更高的建库成本、更复杂的更新机制、更严格的抽取质量控制。如果你的问题只是单点问答,普通 RAG 更简单、更便宜。如果你的业务知识关系密集、文档多、问题经常跨多份资料,那么 GraphRAG 就能显著提升系统的组织能力和回答质量。

2026-05-18 15:25:50 328

原创 面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战

15.1 一个完整答案的主线你可以把整套系统概括为:理解层做输入清洗、意图识别和实体抽取;决策层做对话管理、槽位跟踪和策略选择;执行层负责 FAQ、RAG、GraphRAG、API、工作流和转人工;反馈层负责指标监控、错误分析和数据回流。框架层面,之所以偏向 Rasa Pro,是因为它更适合流程型客服;模型层面,之所以偏向 Qwen 和 8B,是因为它们在中文效果、部署性、时延和成本之间比较均衡;检索层面,FAQ、RAG 和 GraphRAG 并不是互相替代,而是应该按问题复杂度分层路由。

2026-05-18 13:21:41 471

原创 面试题详解:多模态大模型全攻略——ViT 架构、扩散模型、U-Net、VAE、CLIP、Prompt 图像对齐一次讲透

如果把这组问题浓缩成一句话,那就是:ViT 解决图像如何进入 Transformer,CLIP 解决文本和图像如何对齐,扩散模型解决如何从噪声生成图像,U-Net 负责每一步去噪,VAE 负责降低生成成本并还原图像。面试中最能拉开差距的,不是背出一堆模型名,而是能把它们放进同一条链路里讲清楚:图像怎么编码,文本怎么条件化,噪声怎么加,模型怎么学,生成怎么反向去噪,以及当 prompt 和图像不对齐时如何定位和优化。

2026-05-18 09:29:15 317

原创 面试题详解:RAG评估与RAGAS全攻略——如何评价RAG项目效果、关键指标有哪些、RAGAS是什么

4.1 可以把它理解成:面向 RAG 的自动化体检工具RAGAS 全称是 Retrieval Augmented Generation Assessment。它是一套专门面向 RAG 系统的开源评估框架,核心思想是:不要只看最终回答,而是要把“问题、检索上下文、最终回答”一起纳入评估。它之所以受欢迎,是因为很多业务团队并没有特别完整、特别严格的标准答案数据集,但他们仍然希望快速知道系统大致哪里出了问题。RAGAS 的一些指标正好适合这种场景,它能帮助团队用较低成本批量跑出自动化评估结果。

2026-05-18 07:56:52 442

原创 面试题详解:高级 RAG 优化全解析——Query Transformation、混合检索、RAG Fusion、HyDE、Graph RAG 与 Rerank 一次讲透

4.1 大模型可以在召回前帮你“理解问题”大模型辅助召回,不是让大模型直接编答案,而是让它在检索之前或检索之后做辅助判断。检索之前,它可以做意图识别、查询改写、问题分解、同义词扩展、生成多查询。检索之后,它可以判断候选片段是否真的相关,做上下文压缩或重排。4.2 为什么需要大模型辅助召回?因为传统检索器更擅长“相似度匹配”,但不一定懂用户真实任务。比如用户问“这个方案能不能上线”,真正需要的可能是“风险、依赖、测试结果、审批流程、历史事故”。如果直接拿原问题去检索,可能只搜到“上线方案”四个字相关的文档。

2026-05-17 22:58:40 17

原创 RAG 面试题详解:为什么大模型需要外部知识库、RAG 工作流程、PDF 解析与文本分块全解析

7.1 固定长度切分固定长度切分最简单,按字符数或 token 数切,比如每 500 个 token 一个块,再加 50 个 token overlap。优点是实现快、稳定、容易上线;缺点是可能把标题、段落、表格、代码和语义边界切断。7.2 递归切分递归切分会先尝试按更自然的结构切,比如标题、段落、句子;如果块仍然太大,再逐级往下切。它比固定长度更尊重文本结构,是很多 RAG 系统的常见默认方案。7.3 按标题和章节切分对于手册、规范、制度文件、Markdown 文档,按标题和章节切分往往效果很好。

2026-05-17 21:24:51 123

原创 面试题详解:大模型思维链 CoT 推理模型训练全解析——如何微调出带思维链的 LLM、优缺点、SFT 与 RLHF 能不能跳过

如果把整篇文章浓缩成一句话,那就是:带有思维链的推理模型,不是靠简单让模型多写几句就能得到的,而是需要高质量推理数据、冷启动 SFT、采样筛选、奖励或偏好优化、评估治理共同配合。SFT 的价值,是把模型拉到一个稳定、可控、可优化的输出分布;RLHF 或 RL 的价值,是在此基础上进一步提升推理质量、偏好对齐和安全性。跳过 SFT 并非绝对不可能,但大多数真实业务场景中,先 SFT 再 RLHF 仍然是更稳妥、更可控的路线。

2026-05-17 20:20:25 141

原创 面试题详解:RLHF、PPO、DPO、Reward Model、on-policy/off-policy 全解析——大模型对齐训练高频面试题一次讲透

这组题的主线其实很清楚:人类偏好先变成 chosen/rejected 或 reward 信号,然后模型通过 PPO 或 DPO 等方式把这种偏好吸收到参数里。PPO 是传统路线,能力强但工程复杂;DPO 是更轻量的偏好优化路线,稳定省资源但更依赖数据质量。

2026-05-17 18:45:11 155

原创 面试题详解:Agent 记忆管理全解析——历史对话获取、摘要记忆、事实记忆、知识图谱记忆一次讲透

4.1 摘要记忆解决的是“长会话装不下”的问题当会话越来越长时,一个自然思路就是:不是把旧对话原样保留,而是把它压缩成摘要。也就是说,把对话中最重要的目标、约束、结论、任务进度和关键事实总结出来,作为长期脉络保留。这样做的好处是非常直观的:历史对话从“原文级存储”变成了“信息级存储”。模型不再需要看到全部旧消息,但仍然能够知道这段会话之前大致发生了什么。4.2 摘要记忆的价值与风险摘要记忆很适合长会话、长期助手、复杂任务拆解这类场景。它能大幅降低 token 成本,也能帮助系统保留较长时间跨度的任务主线。

2026-05-17 16:49:58 285

原创 面试题:LangChain Agent 相关全解析——大模型 Agent、AgentExecutor、创建方式、实现思路与领域知识注入

5.1 AgentExecutor 不是 Agent 本身,而是执行器AgentExecutor 可以理解成“运行 Agent 的外壳”。Agent 负责决定下一步要做什么,Tools 负责执行具体动作,而 AgentExecutor 负责循环调度、把工具结果交回模型、判断是否继续、控制最大轮数、处理异常和返回最终结果。5.2 为什么需要 AgentExecutor?如果没有执行器,模型只会告诉你“我想调用某个工具”,但不会真正形成可控的运行闭环。

2026-05-17 15:24:38 278

原创 面试题:Function Call 函数调用详解——为什么需要函数调用、定义与完整流程、工具调用目的、Agent 落地与工程实践全解析

3.1 最容易理解的定义Function Call 可以理解成:开发者先把外部工具用标准格式描述给模型,模型在对话过程中根据用户意图判断是否需要使用某个工具,并输出工具名和结构化参数,最后由程序真正执行工具,再把结果交回模型。注意这里有一个非常关键的边界:模型不是直接执行函数。模型只是生成“我要调用哪个函数、参数是什么”的请求;真正的函数调用、权限校验、异常处理和结果返回,都由业务系统完成。3.2 为什么一定要强调职责边界?因为很多初学者会误以为“模型调用函数”就是模型自己运行代码。

2026-05-17 13:47:44 296

原创 面试题:LangChain 基本概念详解——Components、Prompt Templates、Output Parsers、Retrieval、Agents、Toolkits、向量数据库全解析

LangChain Model 是对不同模型供应商的统一封装。它让开发者可以用相对一致的方式调用 OpenAI、Anthropic、Google、开源模型、本地模型等。常见类型包括 ChatModel、LLM 和 Embedding Model。ChatModel 面向聊天消息,通常输入 messages,输出 AIMessage;LLM 更偏传统文本补全;Embedding Model 则把文本转成向量,用于检索、聚类、相似度计算。

2026-05-17 11:18:16 483

原创 面试题:SFT 数据集详解——监督微调数据格式、数据集来源、数据清洗、Temperature 温度参数与合成数据策略全解析

5.1 Temperature 是推理阶段常见的采样参数Temperature 可以理解成一个控制输出随机性的旋钮。低温度时,模型更倾向于选择概率最高的答案,输出更稳定、更保守;高温度时,概率分布会更平,更多备选答案也有机会被选中,输出会更发散、更有创造性。注意:Temperature 通常不是 SFT 数据集里的字段,而是在推理或用强模型合成数据时设置的参数。它本身不等于“训练强度”,也不等于“模型聪明程度”。5.2 低温度适合什么场景?

2026-05-17 10:18:27 314

原创 面试题:PEFT-LoRA 及变种详解——LoRA 原理、矩阵初始化、作用矩阵、Rank/Alpha 选择、过拟合治理、rsLoRA/AdaLoRA/DoRA/LoRA-GA/QLoRA 全解析

10.1 QLoRA 的核心思路QLoRA 可以理解成“量化底座 + LoRA 训练”。它把预训练大模型以 4-bit 形式加载并冻结,只训练 LoRA 适配器。这样既保留了大模型能力,又显著降低了显存需求。10.2 QLoRA 为什么省显存?因为基础模型权重被量化成更低比特,并且不参与训练。训练时主要更新 LoRA 小矩阵,而不是整套大模型参数。QLoRA 还引入了 NF4、双重量化、分页优化器等技术进一步降低显存压力。10.3 QLoRA 的优缺点优点是显存占用低,能在资源有限的设备上微调更大模型;

2026-05-17 09:16:29 407

apache-tomcat-9.0.0.M18免安装包

apache-tomcat-9.0免安装包

2017-03-25

SwitchHosts免安装包

SwitchHosts用于快速修改window的hosts文件

2017-04-24

linux Redis安装步骤及安装包

linux Redis安装步骤及安装包

2017-04-18

SQLyogEnt安装文件

SQLyogEnt

2017-04-07

nginx压缩包和安装手册

nginx压缩包和安装手册

2017-04-07

Java高并发程序设计模式资料

Java高并发程序设计模式

2017-03-29

keepalived高可用

keepalived高可用linux安装包

2017-04-24

Json字符串格式化工具

Json字符串格式化工具

2017-04-12

Java编程思想第四版完整中文高清版(免费)

Java编程思想第四版完整中文高清版(免费)

2017-03-25

Foxmail_7.1.3安装文件

Foxmail_7.1.3安装文件

2017-04-07

软件项目管理资料

软件项目管理资料

2017-03-24

restclient-ui-3.5开发包

restclient-ui-3.5,可以测试包括服务层中各种post,get之类的请求

2017-04-12

notepad++安装文件

notepad++安装文件

2017-03-29

360截图安装文件

360截图

2017-04-07

Linux命令大全

Linux命令大全

2017-04-12

maven课程文件

maven课程

2017-03-24

单点登录文档

单点登录

2017-03-24

FileZilla_3.25.0_XiaZaiBa+vsftpd安装手册

FileZilla_3.25.0_XiaZaiBa+vsftpd安装手册

2017-04-08

myeclipse svn插件

svn插件

2017-03-24

WebService笔记

WebService笔记

2017-03-24

面试题总汇

JAVA面试题总汇

2017-05-11

solr的安装使用步骤

solr的安装使用步骤

2017-05-12

SolrCloud集群搭建和使用步骤

SolrCloud集群搭建和使用步骤

2017-05-13

Java程序员面试宝典

《Java程序员面试宝典》主要内容简介:目前许多开发者对Java语言及其底层原理掌握不牢固,在面试过程中经常漏洞百出,无法取得好成绩。而招聘单位为了得到高素质的员工往往使出浑身解数,采用各种形式的面试考察求职者,这让面试难度大大增加。求职者要想成功应聘,不仅需要扎实的基本功,还需要经受情商和智商方面的考查。《Java程序员面试宝典》通过200个面试题,对企业招聘Java程序员需要掌握的知识进行了系统、全面的总结,以帮助读者进行充分的面试准备,在激烈的竞争中拔得头筹。《Java程序员面试宝典》列举了各大IT公司的面试真题,详细分析了应聘Java程序员职位的常见考点,主要内容包括面试流程及求职准备、Java语言基础、数据类型、集合框架、图形用户界面、输入与输出、多线程、反射机制、网络编程、JDBC、Web开发基础、SSH框架(Struts、Spring和Hibernate)、EJB、JPA、算法、设计模式及情商和智商类面试题。《Java程序员面试宝典》附带1张DVD光盘,内容为《Java程序员面试宝典》所有面试题的多媒体教学视频(共14.5小时)及免费赠送的55小时Java教学视频和5.5小时算法教学视频。授人以鱼,不如授人以渔。《Java程序员面试宝典》中的面试题不但以实例代码和流程图的形式对答案进行了详细解析,还对问题的相关知识点进行了扩展说明。希望通过《Java程序员面试宝典》,读者可以成功应聘,并提升综合素质。《Java程序员面试宝典》适合应聘Java和J2EE职位的程序员阅读,也适合其他程序员作为拓展读物进行阅读。

2017-05-03

linux jdk1.8 64位

Java Development Kit 8 for liunx简称jdk 1.8 linux版,是一款可以在linux系统上安装使用的java程序,本站提供了jdk-8u131-linux-x64.tar.gz下载地址,有需要的朋友们欢迎前来下载使用.

2017-10-31

Linux jdk1.8 32位

Java Development Kit 8 for liunx简称jdk 1.8 linux版,是一款可以在linux系统上安装使用的java程序,本站提供了jdk-8u131-linux-x64.tar.gz下载地址,有需要的朋友们欢迎前来下载使用.

2017-10-31

redisclient免安装破解文件

redisclient免安装破解文件 redisclient免安装破解文件

2017-10-31

RabbitMQ-3.4.1安装文件+Spring-rabbit+RabbitMQ-3.4.1安装手册

RabbitMQ-3.4.1安装文件+Spring-rabbit+RabbitMQ-3.4.1安装手册

2017-07-12

SecureCRT免安装破解文件

SecureCRT免安装破解文件 SecureCRT免安装破解文件 SecureCRT免安装破解文件

2017-10-31

基于storm实时热点统计的分布式并行缓存预热

一、基于nginx+lua完成商品详情页访问流量实时上报kafka的开发 ==================================== 在nginx这一层,接收到访问请求的时候,就把请求的流量上报发送给kafka 这样的话,storm才能去消费kafka中的实时的访问日志,然后去进行缓存热数据的统计 用得技术方案非常简单,从lua脚本直接创建一个kafka producer,发送数据到kafka ``` wget https://github.com/doujiang24/lua-resty-kafka/archive/master.zip yum install -y unzip unzip lua-resty-kafka-master.zip cp -rf /usr/local/lua-resty-kafka-master/lib/resty /usr/hello/lualib nginx -s reload local cjson = require("cjson") local producer = require("resty.kafka.producer") local broker_list = { { host = "192.168.31.187", port = 9092 }, { host = "192.168.31.19", port = 9092 }, { host = "192.168.31.227", port = 9092 } } local log_json = {} log_json["headers"] = ngx.req.get_headers() log_json["uri_args"] = ngx.req.get_uri_args() log_json["body"] = ngx.req.read_body() log_json["http_version"] = ngx.req.http_version() log_json["method"] =ngx.req.get_method() log_json["raw_reader"] = ngx.req.raw_header() log_json["body_data"] = ngx.req.get_body_data() local message = cjson.encode(log_json); local productId = ngx.req.get_uri_args()["productId"] local async_producer = producer:new(broker_list, { producer_type = "async" }) local ok, err = async_producer:send("access-log", productId, message) if not ok then ngx.log(ngx.ERR, "kafka send err:", err) return end ``` 两台机器上都这样做,才能统一上报流量到kafka ``` bin/kafka-topics.sh --zookeeper 192.168.31.187:2181,192.168.31.19:2181,192.168.31.227:2181 --topic access-log --replication-factor 1 --partitions 1 --create bin/kafka-console-consumer.sh --zookeeper 192.168.31.187:2181,192.168.31.19:2181,192.168.31.227:2181 --topic access-log --from-beginning ``` (1)kafka在187上的节点死掉了,可能是虚拟机的问题,杀掉进程,重新启动一下 nohup bin/kafka-server-start.sh config/server.properties & (2)需要在nginx.conf中,http部分,加入resolver 8.8.8.8; (3)需要在kafka中加入advertised.host.name = 192.168.31.187,重启三个kafka进程 (4)需要启动eshop-cache缓存服务,因为nginx中的本地缓存可能不在了 二、基于storm+kafka完成商品访问次数实时统计拓扑的开发 ==============

2018-03-19

实现mysql读写分离+使用视频

实现mysql读写分离+使用视频

2017-07-12

Linux jdk1.7 64位

jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz jdk1.7.0(linux_x64_1.7.0_80).tar.gz

2017-10-31

权限管理视频

权限管理视频

2017-06-23

solr-4.10.3

solr-4.10.3安装包

2017-05-12

Scrum敏捷项目管理ppt

Scrum敏捷项目管理ppt

2017-04-29

mysql的yum源包

mysql的yum源包

2017-04-25

各大知名企业面试题

ACM程序设计导引及在线实践 程序员代码面试指南 剑指offer 软件技术基础:离散数学、数据结构、C.编程实训 .来可伟.文字版 2016奇虎360C++研发工程师内推笔试题 2016奇虎360JAVA研发工程师内推笔试题 阿里巴巴2015校招研发 阿里巴巴2016前端开发工程师笔试二 阿里巴巴2016前端开发工程师笔试一 阿里巴巴2016数据挖掘工程师笔试 阿里巴巴2016研发工程师笔试选择题二 阿里巴巴2016研发工程师笔试选择题三 阿里巴巴2016研发工程师笔试选择题四 阿里巴巴2016研发工程师笔试选择题一 百度2015安全研发笔试卷 百度2015大数据云计算研发笔试卷 百度2015前端研发笔试卷 百度研发工程师2015深圳笔试卷 美团2016研发工程师模拟笔试题 人人网2015研发笔试卷A 人人网2015研发笔试卷E 搜狗2015JAVA工程师笔试题 腾讯2016研发工程师笔试真题二 腾讯2016研发工程师笔试真题三 腾讯2016研发工程师笔试真题一

2018-04-24

IK分词器+tomcat-7.0.47+jdk+sol+zookeepe

IK分词器+apache-tomcat-7.0.47.tar.gz+jdk-7u55-linux-i586.tar.gz+solr-4.10.3.tgz.tgz+zookeeper-3.4.6.tar.gz

2017-05-12

Solr集群环境

Solr集群安装环境

2017-05-12

zookeeper-3.4.6压缩包

zookeeper-3.4.6压缩包

2017-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除