lenyan~-CSDN博客

原创 DeepSeek V3.2 深度解析：首个会“思考“的Agent模型，开源性能比肩GPT-5

DeepSeek V3.2正式版发布，作为首个将"思考"融入工具调用的开源模型，性能比肩GPT-5。其创新点包括：1) 智能切换思考模式，提升复杂任务处理能力；2) 数学推理能力突出，数学专用模型DeepSeek-Math-V2在IMO等竞赛中表现优异；3) 采用DSA稀疏注意力机制，支持128K上下文；4) API价格直降50%，完全开源。该模型在Agent任务、编程开发和中文处理方面表现突出，但在多模态和极复杂任务上仍有不足。V3.2的发布标志着开源模型性能已接近商业顶级模型水平。

2025-12-15 09:00:00 1061

原创 Claude Code 记忆持久化方案：彻底解决跨会话失忆问题

本文介绍了解决Claude Code跨会话失忆问题的持久化记忆方案。重点推荐了轻量级工具claude-mem，它能自动捕获对话关键信息并存储到本地数据库，在新会话时自动注入相关记忆。文章详细说明了安装步骤（需PM2进程管理工具）、核心功能（自动记忆捕获、语义搜索、Web管理界面）以及最佳实践建议。该方案适合仅使用Claude Code的开发者，安装简单且全自动工作，能显著提升长期项目开发效率。

2025-12-15 09:00:00 434

原创 GPT-5.2 来了！AI 大模型竞争白热化，开发者该如何应对？

OpenAI发布GPT-5.2，AI大模型竞争进入白热化阶段。该版本定位为"真实工作"模型，在专业任务上显著提升，并推出三档版本满足不同需求。当前行业呈现OpenAI、谷歌和Anthropic三足鼎立之势，微软、迪士尼等巨头纷纷布局AI生态。对开发者而言，Agent开发成为新机遇，但需警惕AI替代风险，建议聚焦系统设计等核心能力。短期应体验新工具，中期建立AI工作流，长期培养业务理解力。尽管AI能力增强，幻觉问题和成本考量仍需注意。技术快速迭代下，开发者应主动适应而非焦虑。

2025-12-13 09:00:00 1038

原创 GPT-5.2 深度技术解析：OpenAI 最强模型的架构与性能突破

OpenAI 发布 GPT-5.2，采用三档分层架构 (Instant/Thinking/Pro)，支持 128K-256K 长上下文，推理能力新增 xhigh 等级，编程错误率降低 38%，效率提升 390 倍。已集成至 GitHub Copilot，标志 AI 从演示型向生产型转变。

2025-12-13 09:00:00 971

原创 OpenAI Codex CLI 完全指南：AI 编程助手的终端革命

OpenAI Codex CLI是本地运行的AI编程助手，基于Rust构建，开源免费，支持macOS、Linux、Windows(WSL2)，需Node.js v22+，有三种安装方式。可通过ChatGPT账号/API Key认证，提供三种操作模式，支持代码审查、重构等功能，还适配MCP服务器和主流IDE，2025年底推出的GPT-5.1-Codex-Max模型提升了编码处理能力。

2025-12-09 18:00:00 3055

原创 Google Gemini CLI 完全指南：终端中的 AI 编程神器

Google Gemini CLI 是一款开源命令行 AI 工具，将 Gemini 2.5 Pro 的强大功能带入终端。它提供每分钟 60 次、每天 1000 次的免费请求额度，支持代码生成、调试、自动化任务和多模态处理。安装简单，可通过 npm、npx 或 Homebrew 完成，支持 Google 账号、API Key 和 Vertex AI 三种认证方式。核心功能包括代码理解、自动化集成、Google 搜索和 MCP 服务器扩展。项目可通过 GEMINI.md 文件提供上下文，并能集成到 GitHub

2025-12-09 18:00:00 1134

原创 Claude CLI：下一代AI辅助编程工具的革命性体验

Claude CLI是Anthropic推出的开发者专用AI编程助手，命令行形式，支持npm/yarn全局安装。核心功能含智能代码编辑、项目分析、Git集成、任务管理，高级特性包括MCP服务器扩展、自定义命令、并行任务执行。相比GitHub Copilot等竞品，在代码库理解、文件操作与命令执行上更优，可显著提升开发效率。

2025-12-09 16:00:00 2452

原创 AI代码审查助手Demo

文章摘要： AI代码审查助手利用大语言模型技术实现智能化代码质量检测，相比传统人工审查具有显著优势。系统采用分层架构设计，集成多种AI模型和分析工具，提供代码质量检测、安全漏洞扫描、性能分析等核心功能。技术栈包含Spring Boot、OpenAI SDK和代码分析工具，通过GPT-4等AI模型实现自动化代码审查，可降低随机性设置以提高结果可靠性。该系统能实现秒级代码审查，覆盖全部代码，保持标准统一性，并具备持续学习能力。

2025-11-08 09:00:00 1070

原创手写Mini Spring框架

本文介绍了一个手写Mini Spring框架的实现过程，旨在帮助开发者深入理解Spring核心原理。框架实现了IoC容器、依赖注入、AOP等核心功能，采用模块化设计包含Bean工厂、应用上下文、AOP代理等组件。通过实现DefaultListableBeanFactory等核心类，演示了Bean生命周期管理、单例缓存、依赖注入等机制，展现了Spring框架的底层设计思想。该实现有助于开发者掌握控制反转和面向切面编程的底层原理，提升框架设计能力。

2025-11-08 09:00:00 1246

原创 Redis在AI向量数据库场景下的高性能实践

Redis作为AI向量数据库的高性能实践摘要：本文探讨Redis在AI向量数据库场景中的核心应用。Redis凭借内存存储、毫秒级响应和丰富的数据结构，成为向量搜索和RAG系统的理想选择。文章详细解析了Redis向量搜索架构，包括RediSearch、RedisJSON等核心组件，并提供了Spring Boot集成实践方案。重点介绍了向量文档实体设计、索引配置优化以及HNSW算法参数调优等关键技术点，为构建高性能AI应用提供了完整的解决方案框架。通过合理的架构设计和参数配置，Redis能够有效支撑大规模向量

2025-10-14 09:00:00 986

原创 Spring Cloud微服务架构下的AI智能监控与治理实践

本文探讨了Spring Cloud微服务架构中集成AI技术实现智能监控与治理的方法。随着微服务复杂度的提升，传统监控方式已无法满足需求。文章提出了一种结合Spring Cloud与AI技术的架构方案，包含数据采集层、AI分析引擎和智能决策层。核心实现包括智能监控配置、多维度异常检测算法和自动化治理策略，通过AI技术增强异常检测准确性和治理效率。该方案能够应对微服务环境的动态性和复杂性，实现从被动监控到主动预防的转变。

2025-10-14 09:00:00 1071

原创构建基于Java技术栈的AI Agent系统

本文介绍了使用Java技术栈构建AI Agent系统的完整方案。系统采用分层架构设计，包含Web层、应用层和基础设施层，核心模块包括Agent引擎、知识库和任务编排器。关键技术选型涵盖Spring AI框架、PostgreSQL数据库、Redis缓存、RabbitMQ消息队列和Pinecone向量数据库等组件。系统配置通过Spring Boot实现，包括AI模型参数、数据源连接和监控设置。该方案充分利用了Java生态系统的成熟度，结合Spring Cloud微服务架构，为企业级AI应用提供了高性能、可扩展的

2025-10-09 09:00:00 1295

原创基于RabbitMQ的AI任务调度与流式处理系统

摘要本文介绍了基于RabbitMQ构建AI任务调度与流式处理系统的设计方案。系统采用分布式架构，通过RabbitMQ实现任务的高效调度和处理，包含任务分类、队列设计、生产者实现、消费者集群等核心模块。通过优先级队列、死信队列等机制保证任务处理的可靠性和灵活性，支持多种AI任务类型（文本、图像、语音等）的并行处理。系统还提供了资源管理、故障恢复和性能优化等关键功能，能够满足大规模AI推理任务的高并发、低延迟需求。

2025-10-09 09:00:00 988

原创 Spring AI与智能代理模式的深度解析

本文深入解析了Spring AI框架中的智能代理模式实现。文章首先介绍智能代理的概念及其核心特征（感知、决策、执行和学习），然后详细阐述Spring AI的架构设计和核心组件。通过代码示例展示了基础代理接口设计和Spring AI集成实现，包括上下文理解、向量检索和AI模型调用等关键步骤。文章还提供了智能代理系统的实战案例和性能优化建议，为Java开发者构建高效AI代理提供完整解决方案。(149字)

2025-09-30 12:36:05 1340

原创 Java动态代理在Spring AOP中的应用实践

Java动态代理在Spring AOP中的核心应用本文深入解析Java动态代理机制，重点对比JDK动态代理和CGLIB的实现原理。JDK动态代理基于反射机制，通过Proxy类和InvocationHandler接口在运行时生成代理类，适用于接口代理；而CGLIB通过字节码增强技术实现类代理。在Spring AOP中，两种代理方式根据目标对象类型自动选择：接口优先使用JDK代理，否则采用CGLIB。文章通过代码示例展示了方法拦截器链的实现原理，并分析了两者在性能、适用场景上的差异，为Spring AOP的企

2025-09-30 12:32:30 319

原创 [写的就是真实]EasyExcel + 自定义线程池：万级数据流式读取批量导入更新，性能提升75%！

本文分享了实习期间采用EasyExcel和自定义线程池优化万级数据批量导入的技术方案。通过流式读取Excel数据，结合分批次处理和自定义线程池并行执行，实现了75%的性能提升，有效规避了内存溢出风险。详细介绍了线程池配置、数据模型定义、流式读取监听器实现等核心代码，展示了如何将大数据量处理分解为小批量任务并行执行，最终实现高效稳定的数据导入功能。该方案适用于需要处理大规模Excel数据的场景，具有较好的参考价值。

2025-08-21 09:15:00 928

原创 [写的就是真实]大文件分片上传工具：断点续传+并行加速+秒传优化，性能提升300%！

大文件分片上传技术方案摘要本文介绍了一种基于Java的企业级大文件上传解决方案，通过分片上传、断点续传和并行加速等技术，实现了性能提升300%、支持TB级文件上传的目标。方案采用Spring Boot框架，结合Redis存储断点信息，实现动态分片策略（5MB-50MB可调）、断点续传管理和秒传校验功能。核心实现包括：1）智能分片服务，根据文件大小动态计算最优分片；2）断点续传服务，利用Redis持久化上传进度；3）并行上传优化，通过自定义线程池加速传输。该方案已成功应用于企业文件管理系统，完美解决大文件上

2025-08-21 09:00:00 742

原创智能体未来趋势：多智能体协作与通信协议

想知晓 AI 智能体的未来方向？本文聚焦多智能体协作与通信协议。解析工作流编排的核心模式，如提示链、路由、并行等，附 Java 实现代码。介绍 OWL 多智能体协作框架及技术特点，详解 A2A 智能体通信协议的关键要素，对比其与 MCP 协议的差异。助你把握智能体协作化、专业化趋势，洞察未来应用前景。

2025-07-10 09:00:00 1068

原创智能体高级功能：工具集成与性能优化

想让 AI 智能体更强大高效？本文聚焦智能体高级功能开发。详解工具系统架构，含统一接口设计与管理，附网络搜索、图像搜索等实用工具代码。分享循环检测、上下文优化、超时控制等性能优化策略。还展示专业场景定制实例，助你扩展智能体能力边界，提升其可靠性与用户体验，轻松应对复杂任务。

2025-07-10 09:00:00 1194

原创从零构建AI智能体：架构设计与代码实现

想亲手打造会思考、能调用工具的 AI 智能体？本文带你从架构到代码实操。解析 OpenManus 分层架构，用 Java 和 Spring AI，从基类到工具调用层逐步实现。含工具开发、循环检测等实用模块，助你掌握核心技术，拥有专属智能体！

2025-07-07 09:00:00 997

原创 AI智能体入门：概念、技术与应用全解析

想了解 AI 智能体的奥秘吗？本文全面解析其概念、技术与应用。从核心架构到工作流程，详解智能体如何感知环境、自主决策。深入剖析 CoT 思维链、Agent Loop 执行循环、ReAct 模式等关键技术，附代码实现。还介绍记忆系统、知识库等支持组件，以及平台使用、开发工具集成、程序调用等应用方式，覆盖客服、数据分析等多场景。无论新手还是开发者，都能快速掌握智能体核心知识。

2025-07-07 09:00:00 1143

原创 3步搞定MCP协议部署！

MCP协议为企业AI系统提供了标准化的工具集成方案，支持本地与远程调用模式，适用于多场景部署。文章深入探讨了其在金融、医疗和制造业的应用策略，并结合Spring框架展示了服务注册、工具开发及安全合规实现。通过合理架构设计、治理规范与性能优化，企业可高效整合AI能力与现有系统，提升业务效率并保障安全性。

2025-06-12 09:00:00 1365

原创 MCP协议安全指南｜零基础也能~

MCP协议在提供AI工具调用标准化接口的同时，也面临诸多安全挑战。其设计初衷侧重功能实现而忽视安全性，导致信息不对称、上下文隔离不足、权限验证缺失等隐患。本文系统分析了MCP的安全风险，结合代码审查、环境隔离、网络策略等实践提升安全性，并详解本地、远程及Serverless三种部署模式的应用场景与配置要点，强调安全与便利的平衡。未来需推动协议层深度安全集成与生态治理，确保MCP生态健康发展。

2025-06-12 08:30:00 1455

原创使用Spring AI和MCP协议构建图片搜索服务

本文介绍如何使用Spring AI与MCP协议构建图片搜索服务，通过封装Pexels API实现AI调用图像资源。内容涵盖项目架构设计、服务端与客户端开发步骤、传输模式配置及部署方案，提升AI应用的多模态处理能力，增强交互实用性。

2025-06-09 09:00:00 1532

原创 MCP协议入门：AI工具调用的标准化接口

MCP协议作为AI工具调用的标准化接口，通过统一工具定义和调用流程，增强AI获取实时信息、执行外部操作及使用专业工具的能力。它简化开发、促进生态共享，助力AI应用突破模型限制，广泛适用于云平台、客户端及程序内调用场景。

2025-06-09 08:45:00 996

原创对话记忆持久化方案对比与实现：构建可靠的AI会话系统

Spring AI的对话记忆持久化支持内存、文件、数据库三种方案：内存存储高性能但易丢失，适合开发测试；文件存储兼顾持久化与简易性，适合单实例部署；数据库存储高可靠支持分布式，但依赖运维。文章通过性能对比（写入/读取耗时、扩展性等）指导选型，并提供多模态记忆、向量检索、智能摘要等扩展方案，助力构建生产级AI对话系统。

2025-05-22 09:00:00 1128

原创自定义Advisor机制：打造更智能的AI应用

Spring AI的Advisor机制基于责任链模式，允许开发者在LLM调用链中插入自定义逻辑（如日志记录、违禁词过滤、推理增强），提升应用安全性与智能化水平。其核心接口`CallAroundAdvisor`（同步）和`StreamAroundAdvisor`（流式）通过`getOrder()`控制执行顺序。内置支持对话记忆、知识库检索、向量存储等功能，并可通过实战案例实现情感分析、术语增强等定制化逻辑，结合优先级配置与性能监控，构建高效合规的AI应用。

2025-05-22 08:30:00 1176

原创 GitHub文档加载器设计与实现

GitHub文档加载器可从GitHub仓库加载文件并封装为Document对象，支持单文件/目录递归加载、智能分支回退、文件大小/类型过滤，适用于知识库构建与RAG应用。提供SSL安全测试方案，建议生产环境规范证书验证。核心设计兼顾性能与容错性，助力高效处理开源文档。

2025-05-17 20:51:20 1292

原创构建下一代AI智能体：基于Spring AI的多轮对话应用

本文介绍了如何基于SpringAI框架构建具备持续记忆能力的多轮对话AI应用。首先，文章详细探讨了Prompt工程的核心要素，包括系统Prompt、用户Prompt和助手Prompt的设计，并提出了优化Prompt的技巧，如明确任务角色、提供详细示例、使用结构化格式等。接着，文章分析了AI需求的三要素：需求来源、需求细化和MVP策略。在应用方案设计部分，文章展示了如何设计系统提示词，并通过SpringAI的ChatClient和Advisors实现多轮对话的记忆持久化。最后，文章通过一个恋爱咨询应用的开发实

2025-05-17 08:30:00 1830

原创基于Spring AI实现多轮对话系统架构设计

基于SpringAI框架的多轮对话系统设计，涵盖ChatClient、Advisor、ChatMemory等核心组件，探讨链式调用、动态参数绑定、拦截器机制及多种记忆存储方案，助力构建高效、可扩展的对话系统。

2025-05-12 09:00:00 2462

原创 Prompt工程精要与优化策略：让AI更懂你的意图

本文系统介绍了Prompt工程的理论基础、优化技巧及实战应用，旨在帮助开发者提升AI应用的表现力与实用性。文章首先阐述了Prompt工程的核心三角架构，包括系统Prompt、用户Prompt和助手Prompt的协同作用，并提出了三大维度设计方法，涵盖功能型划分、复杂度梯度和开发级别。接着，文章详细介绍了基础提示技巧和进阶提示策略，如思维链提示法和少样本学习，并通过案例分析展示了从普通到专业的Prompt优化过程。此外，文章还探讨了Prompt模板设计与参数化的实现方法。

2025-05-12 08:30:00 919

原创 Spring AI: 为Java应用赋能人工智能

Spring AI 是 Spring 生态系统的一部分，旨在简化 Java 应用中人工智能功能的集成。它通过统一接口支持多个主流 AI 模型提供商，如 OpenAI 和 Google Vertex AI，并强调可移植性和模块化设计。文章详细介绍了 Spring AI 的核心组件、快速入门步骤和高级功能，例如 RAG（检索增强生成）与向量数据库集成。此外，还涵盖了最佳实践、安全性和性能优化策略，并展望了其未来发展。

2025-04-28 08:30:00 1518

原创 AI大模型接入实战：概念、方式与代码详解

AI大模型是指那些拥有超大规模参数的深度学习模型，它们经过海量数据训练，能够处理多模态数据（如文本、图像、音频等），具备逻辑推理和代码编写等"涌现能力"。这些模型通常拥有数十亿甚至数千亿的参数，能够理解复杂指令并生成高质量的内容。OpenAI：提供GPT-4o（多模态）、GPT-4（文本+图像）、GPT-3.5 Turbo等模型Anthropic：推出Claude 3系列模型Google：开发了Gemini Ultra/Pro/Nano系列Meta：开源了Llama 3和Llama 2模型。

2025-04-28 08:30:00 2060 2

原创深入解析，MyBatis的一二级缓存

MyBatis的二级缓存机制为我们提供了强大的性能优化工具，正确使用可以显著减少数据库访问，提升应用响应速度。一级缓存适用于单会话内的查询优化，无需配置，自动管理二级缓存适用于跨会话的数据共享，需要手动配置，并注意数据一致性问题在实际应用中，应根据业务特性、数据变更频率和一致性要求来选择合适的缓存策略。对于分布式环境，可能需要考虑使用专业的分布式缓存解决方案替代MyBatis原生的二级缓存。正确理解和使用MyBatis的缓存机制，将帮助你在保证数据一致性的同时，最大限度地提升应用性能。

2025-04-07 08:00:00 1611

原创深入理解STAR法则

STAR是**Situation（情境）、Task（任务）、Action（行动）、Result（结果）**的缩写，是一种结构化描述个人经历或成就的方法论。它通过四个维度的递进式叙述，将复杂的故事转化为清晰、有逻辑的表达，尤其适用于需要突出个人能力的场景。Situation（情境）：描述事件发生的背景，包括时间、地点、环境及面临的挑战。Task（任务）：明确你的角色和需要完成的目标。Action（行动）：具体说明你采取了哪些行动，以及背后的思考逻辑。Result（结果）

2025-04-07 01:38:03 6085

原创 Liquibase：数据库变更版本控制工具 CI/CD

Liquibase是一个开源的数据库版本控制工具，它通过日志文件的形式记录数据库的变更，然后执行这些变更，将数据库更新或回滚到一致的状态。Liquibase支持多种数据库类型，包括MySQL、PostgreSQL、Oracle、SQL Server等。除了使用Liquibase的XML标签，还可以直接执行自定义SQL：</</</</Liquibase为数据库版本控制提供了强大且灵活的解决方案。通过将数据库变更作为代码进行管理，开发团队可以更可靠地跟踪、应用和回滚数据库变更，大大降低了跨环境部署的风险。

2025-03-25 08:15:00 1337

原创 Redis Stack 基础知识-构建现代实时数据平台

Redis Stack 是 Redis 官方推出的一站式解决方案，它整合了 Redis 最先进的模块和功能，为开发者提供了构建实时应用的理想平台。Redis Stack 作为现代实时数据平台，不仅继承了 Redis 的高性能特性，还扩展了其数据处理能力，使其成为构建 AI 应用、实时分析系统和高性能应用的理想选择。结合 Spring AI，Redis Stack 可以轻松实现向量数据库功能，为 RAG 系统和其他 AI 应用提供强大的基础设施支持。

2025-03-25 08:00:00 1336

原创 Java类加载器（ClassLoader）知识点总结

类加载器负责将Class文件（字节码）加载到内存中，转为JVM能够识别的Class对象。Java程序运行时，并不是一次性将所有类加载到内存，而是按需加载。Arthas是阿里巴巴开源的Java诊断工具，它可以帮助开发人员分析生产环境中的各种问题，包括类加载问题。类加载器是Java虚拟机的重要组成部分，它将Java程序的字节码动态加载到内存中。理解类加载器的工作原理和双亲委派模型对于解决类加载相关问题、防止类加载安全漏洞具有重要意义。通过Arthas等工具，我们可以更便捷地分析和解决类加载问题。/ω＼

2025-03-05 09:15:00 963

原创 Java 集合框架基础 - 幽默版

ArrayList是查找小能手LinkedList是增删高手HashSet是去重专家TreeMap是排序达人选对英雄,才能在对应场景下发挥最大战斗力!记住:工具千千万,场景不一般。用对工具事半功,用错工具事倍般。/ω＼)，支持一下。如果愿意的话关注一下。会对你有更多的帮助。每天都会不定时更新哦 >人<。

2025-03-05 09:00:00 884

原创 JVM初学者指南：Java虚拟机基础知识笔记

JVM(Java Virtual Machine，Java虚拟机)是运行Java字节码的虚拟机。JVM是Java"一次编写，到处运行"这一特性的关键所在。无论什么平台，只要安装了对应的JVM，就能运行Java程序。跨平台性：Java代码被编译成字节码后，可以在任何安装了JVM的设备上运行自动内存管理：通过垃圾回收机制自动释放不再使用的内存安全性：提供沙箱安全机制，限制Java程序访问本地系统资源JVM是Java生态系统的核心组件，理解JVM的工作原理对于编写高效、稳定的Java应用程序至关重要。

2025-03-03 09:30:00 750

lenyan算法笔记，日常更新自己的笔记而已

空空如也