- 博客(20)
- 收藏
- 关注
原创 Async 注解原理分析
Spring的@Async注解通过动态代理实现异步方法执行,核心流程包括:1)@EnableAsync启动异步支持;2)AsyncAnnotationBeanPostProcessor创建代理;3)拦截方法调用并提交线程池处理。使用建议:自定义线程池避免资源耗尽,注意同类调用失效问题,合理处理返回值和异常。关键点:异步任务由AnnotationAsyncExecutionInterceptor拦截处理,默认使用SimpleAsyncTaskExecutor(需替换),事务需配置REQUIRES_NEW
2025-12-21 15:12:51
959
原创 Spring中的设计模式
Spring框架中应用了多种设计模式,包括工厂模式(BeanFactory)、代理模式(AOP实现)、单例模式(Bean默认作用域)、模板方法模式(JdbcTemplate)等。核心设计思想是控制反转(IoC)和依赖注入(DI),通过容器管理对象依赖关系。此外还应用了观察者模式(事件驱动)、适配器模式(AOP通知处理)、装饰者模式(动态功能扩展)等模式,这些设计模式的运用使Spring具有高度灵活性和可扩展性。
2025-12-20 13:42:53
792
原创 Spring Bean生命周期与循环依赖全解析
本文系统介绍了Spring框架中Bean管理的核心概念。主要内容包括:1) Bean的定义及常用注解(@Component、@Repository等)的区别;2) 依赖注入的三种方式及推荐做法;3) @Autowired与@Resource注解的异同;4) Bean的五种作用域及线程安全问题;5) Bean生命周期的四个阶段;6) 循环依赖问题的三种情况及解决方案,重点分析了三级缓存机制在单例模式下的应用原理。文章还探讨了@Lazy注解解决循环依赖的局限性,强调最佳实践是避免设计上的循环依赖。
2025-12-20 13:40:00
712
原创 Spring AI MCP Server Starter:快速构建MCP服务器
SpringAIMCPServerStarter是为SpringBoot应用提供MCP(模型上下文协议)服务器自动配置的组件,支持SYNC/ASYNC两种服务器类型和STDIO、WebMVCSSE、WebFluxSSE三种传输协议。它内置工具、资源、提示词、补全四大核心功能,支持变更通知、上下文传递等特性,能无缝集成SpringAI工具框架。通过自动注册SpringBean规范,开发者可以快速搭建MCP服务器并实现客户端交互,适用于命令行工具、Web应用和响应式系统等多种场景。
2025-12-19 10:24:51
882
原创 Spring AI MCP 客户端 Boot Starter 全解析
SpringAIMCP客户端BootStarter是为SpringBoot应用提供MCP协议客户端自动配置的组件,支持STDIO、SSE和SSEWebFlux三种传输协议,提供SYNC/ASYNC两种客户端类型。具备多实例管理、自动初始化、生命周期管理等核心功能,可与SpringAI工具执行框架集成。通过配置文件可灵活定义连接参数,支持自定义客户端行为,适用于需要与MCP服务器交互的AI应用。组件提供标准版和WebFlux版两种Starter,支持同步/异步通信模式,生产环境推荐使用SSEWebFlux协议
2025-12-19 10:23:43
798
原创 Memory Sharing(MS, 共享记忆)框架
共享记忆(MS)框架通过构建多智能体共享记忆池,解决LLM智能体在开放式任务中示例不足、理解有限的问题。该框架将智能体生成的提示-回答对作为可复用记忆存入全局池,通过动态检索和更新机制增强上下文学习能力。核心组件包括记忆生成、写入和检索,确保高质量记忆的积累和精准匹配。实验表明,MS框架能显著提升智能体在文学创作、逻辑推理等任务中的表现,打破记忆孤岛并降低开放式任务门槛,实现系统的持续优化。
2025-12-18 16:48:38
1270
原创 上下文工程
上下文工程是优化大语言模型(LLM)动态上下文管理的系统性方法,旨在解决智能体在长时运行中的上下文爆炸和性能衰减问题。核心策略包括卸载、缩减、检索、隔离和缓存上下文,通过外部存储、智能摘要、语义搜索等技术降低Token消耗,提升响应效率。典型应用涵盖研究助手、多模态系统和企业自动化场景。多智能体架构通过任务分解和上下文隔离显著提升性能,但面临注意力分散、工具调用复杂等挑战。未来将聚焦自动化管理、多模态融合和标准化框架建设,推动AI智能体向生产级工具演进。
2025-12-18 16:43:37
1133
原创 RAG 查询重写
RAG系统中查询重写技术通过多策略优化解决用户查询模糊、复杂或依赖上下文的问题。多查询重写生成语义相关的查询变体提升召回率;问题分解将复杂查询拆解为子问题逐个检索;Step-Back策略先检索抽象框架再定位细节;指代消解解决对话中的代词指代问题。四种策略协同应用可显著提升检索效果:召回率提升20-30%,复杂查询准确率提升40-50%,专业查询漏检率降低35-45%,对话场景错误率降低50-60%。实现时需根据查询类型灵活组合策略,平衡效果与成本。
2025-12-17 10:33:55
848
原创 多路召回(Multi-Route Retrieval)
多路召回技术通过并行执行多种检索策略(关键词、语义、多模态等),再采用融合算法(RRF、加权排名)生成最终结果,有效解决单一检索的局限性。其架构包含多策略并行检索(稀疏/稠密/多模态)、智能融合算法和动态调优机制。Milvus等工具支持混合检索实现,典型步骤包括数据预处理、索引构建和多路召回执行。该技术优势在于多维度语义覆盖、场景动态适配和成熟工程化落地,适用于医疗、电商等需要高召回率的领域。
2025-12-17 10:31:01
1573
原创 向量数据库索引与检索类型
摘要:向量数据库通过高效索引技术实现语义检索,核心分为数据结构(哈希/树/图/倒排)和压缩(平坦/量化)两大维度。主流组合方案包括IVF-PQ(平衡型)、HNSW-PQ(高维优选)和Vamana(超大规模)。选型需权衡数据量、维度、精度与资源,HNSW现为高维事实标准,IVF-PQ适合内存受限场景,Vamana专注磁盘优化。未来趋势包括硬件加速、多模态索引和自动调参技术。
2025-12-16 10:26:34
698
原创 向量数据库:解锁AI时代的语义搜索
向量数据库是一种专门用于高效存储、索引和搜索高维向量数据的系统,通过AI模型将非结构化数据转化为向量,实现基于语义的相似性检索。与传统数据库不同,向量数据库无需人工标注即可自动关联语义相似的内容。
2025-12-16 10:21:44
768
原创 Java 面试小册 | HashMap 的 put 方法
本文通过面试对话形式解析了Java HashMap的put方法核心机制。重点包括:1)putVal流程(初始化→哈希计算→数据插入→扩容检查);2)扰动算法通过高低位异或增强散列性;3)链表转红黑树需同时满足长度>8且数组>64;4)扩容触发条件为size超过容量×0.75,采用数组翻倍并优化迁移策略。这些源码细节对理解HashMap性能优化至关重要。
2025-12-15 09:24:24
728
原创 一文看懂 Claude Skills 原理
Claude Skills 是 Anthropic 推出的模块化AI能力扩展方案,通过"文件系统封装+渐进式披露"机制,为智能体注入标准化领域知识。其核心特点包括:1) 模块化封装元数据、指令和资源三要素;2) 分层加载机制显著降低token消耗;3) 与MCP工具调用协议形成"知识+工具"协同;4) 支持快速构建智能导购等专业应用。该方案解决了传统智能体知识零散、上下文冗余、复用困难等痛点,已成为工业级AI系统的标配能力。
2025-12-15 09:01:40
1429
原创 工具调用(@Tool)
摘要:SpringAI提供三种工具定义方式(声明式@Tool、编程式MethodToolCallback、动态@Bean),支持信息检索与执行操作两类核心场景。工具通过ChatClient/ChatModel配置,由ToolCallingManager管理执行生命周期,具备自动生成JSONSchema、结果转换、上下文传递等能力。模型仅发起工具调用请求,实际执行由应用完成,确保安全性。支持框架自动执行与手动控制两种模式,提供异常处理和可观测性支持,通过日志和追踪监控工具执行过程。
2025-12-14 10:05:18
878
原创 MCP 实现
MCP(Model Context Protocol)是一种标准化的大语言模型工具调用交互协议,旨在实现AI工具安全高效地调用本地/远程资源。该协议定义了5个核心角色(主机、客户端、服务器、本地/远程数据源),支持两种实现方式:基于stdio的嵌入式本地调用和基于SSE的远程服务调用。MCP通过@Tool注解封装工具方法,实现与FunctionCall类似但更标准化的功能,特别强调通信协议标准化和多场景适配。其核心价值在于提供统一接口、实现业务解耦、确保安全可控,并能促进AI工具生态发展。最佳实践建议工具设
2025-12-14 09:59:33
1068
原创 Chain-of-Thought Prompting(CoT, 管道模式)
摘要:提示链(PromptChain)是大语言模型处理复杂任务的核心方法,通过"分而治之"将任务拆解为独立子问题,构建模块化工作流。其核心价值在于降低认知负荷、提升可解释性和可控性,突破单一提示的局限性。关键技术包括结构化输出、步骤粒度控制和错误重试机制,适用于信息处理、复杂问答、内容生成等场景。未来将向自适应、多智能体和多模态方向发展,成为构建高级AI系统的基础框架。掌握提示链是运用LLM解决复杂问题的工程化思维体现。
2025-12-12 10:30:28
821
原创 MCP 协议 Streamable HTTP 传输层的技术升级
MCP协议引入的StreamableHTTP传输层通过三大创新设计解决了AI通信的核心痛点:统一通信端点简化架构,动态流式传输适配多样化场景,会话状态管理支持断线恢复。性能测试显示,相比传统HTTP+SSE方案,StreamableHTTP在高并发下连接数减少93%,时延波动降低95%,代码量缩减60%,显著提升企业级AI应用的稳定性和开发效率。该方案兼容现有HTTP生态,特别适合金融、医疗等需要高可靠性的场景,以及边缘计算等网络不稳定环境,为AI服务的规模化部署提供了关键通信支撑。
2025-12-12 10:14:58
1104
原创 Reasoning-Acting(ReAct)
摘要:ReAct(推理-行动)是大语言模型智能体实现自主决策的核心范式,通过"思考→行动→反馈"闭环机制,使AI系统具备动态决策、工具集成和适应反馈的能力。该范式包含观察、思考、行动、反馈、状态更新五个步骤,解决了传统LLM在幻觉、工具集成和动态适应等方面的痛点。ReAct适用于复杂问答、任务规划、故障排查等场景,其落地需要合理设计推理Prompt、明确工具参数、设置终止条件和完善错误处理机制。未来ReAct将向多智能体协作、多模态交互和强化学习优化方向发展,是构建高级AI系统的重要基础
2025-12-11 15:58:15
938
原创 AI应用开发
企业级AI系统开发存在两条技术路径:自研/框架开发(如LangChain)与低代码平台(如Dify)。前者适合高定制化需求,提供完全自主的技术栈选择和深度优化能力,但开发成本高;后者侧重快速上线,通过可视化界面降低技术门槛,但灵活性受限。核心差异体现在开发成本、技术控制度、运维复杂度和迭代速度等方面。选型需权衡团队能力、业务复杂度与效率需求:技术团队追求性能优化选自研,非技术团队快速验证选平台。二者在准确性、稳定性和扩展性等维度各具优势。
2025-12-11 15:16:33
511
原创 AI 基础概念
本文系统分析了大型语言模型(LLM)及其关键技术体系。LLM以超大规模参数和海量训练数据为基础,具备跨领域通用能力和涌现特性,但存在高算力需求。围绕LLM的三大关键技术包括:1)RAG通过检索外部知识库解决模型知识过时和幻觉问题;2)记忆机制分为短期会话记忆和长期知识记忆,实现交互连贯性和个性化;3)智能体(Agent)通过工具调用(MCP)和多智能体协作(A2A)形成自主任务处理能力。这些技术共同推动AI从被动响应向主动解决复杂任务进化,构成"思考-记忆-行动-协作"的完整智能系统。
2025-12-10 16:27:16
927
1
natapp内网穿透工具
2025-12-14
Maven构建依赖管理工具
2025-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅