- 博客(264)
- 收藏
- 关注
原创 DeepSeek V3.2 深度解析:首个会“思考“的Agent模型,开源性能比肩GPT-5
DeepSeek V3.2正式版发布,作为首个将"思考"融入工具调用的开源模型,性能比肩GPT-5。其创新点包括:1) 智能切换思考模式,提升复杂任务处理能力;2) 数学推理能力突出,数学专用模型DeepSeek-Math-V2在IMO等竞赛中表现优异;3) 采用DSA稀疏注意力机制,支持128K上下文;4) API价格直降50%,完全开源。该模型在Agent任务、编程开发和中文处理方面表现突出,但在多模态和极复杂任务上仍有不足。V3.2的发布标志着开源模型性能已接近商业顶级模型水平。
2025-12-15 09:00:00
1060
原创 Claude Code 记忆持久化方案:彻底解决跨会话失忆问题
本文介绍了解决Claude Code跨会话失忆问题的持久化记忆方案。重点推荐了轻量级工具claude-mem,它能自动捕获对话关键信息并存储到本地数据库,在新会话时自动注入相关记忆。文章详细说明了安装步骤(需PM2进程管理工具)、核心功能(自动记忆捕获、语义搜索、Web管理界面)以及最佳实践建议。该方案适合仅使用Claude Code的开发者,安装简单且全自动工作,能显著提升长期项目开发效率。
2025-12-15 09:00:00
434
原创 GPT-5.2 来了!AI 大模型竞争白热化,开发者该如何应对?
OpenAI发布GPT-5.2,AI大模型竞争进入白热化阶段。该版本定位为"真实工作"模型,在专业任务上显著提升,并推出三档版本满足不同需求。当前行业呈现OpenAI、谷歌和Anthropic三足鼎立之势,微软、迪士尼等巨头纷纷布局AI生态。对开发者而言,Agent开发成为新机遇,但需警惕AI替代风险,建议聚焦系统设计等核心能力。短期应体验新工具,中期建立AI工作流,长期培养业务理解力。尽管AI能力增强,幻觉问题和成本考量仍需注意。技术快速迭代下,开发者应主动适应而非焦虑。
2025-12-13 09:00:00
1038
原创 GPT-5.2 深度技术解析:OpenAI 最强模型的架构与性能突破
OpenAI 发布 GPT-5.2,采用三档分层架构 (Instant/Thinking/Pro),支持 128K-256K 长上下文,推理能力新增 xhigh 等级,编程错误率降低 38%,效率提升 390 倍。已集成至 GitHub Copilot,标志 AI 从演示型向生产型转变。
2025-12-13 09:00:00
971
原创 OpenAI Codex CLI 完全指南:AI 编程助手的终端革命
OpenAI Codex CLI是本地运行的AI编程助手,基于Rust构建,开源免费,支持macOS、Linux、Windows(WSL2),需Node.js v22+,有三种安装方式。可通过ChatGPT账号/API Key认证,提供三种操作模式,支持代码审查、重构等功能,还适配MCP服务器和主流IDE,2025年底推出的GPT-5.1-Codex-Max模型提升了编码处理能力。
2025-12-09 18:00:00
3055
原创 Google Gemini CLI 完全指南:终端中的 AI 编程神器
Google Gemini CLI 是一款开源命令行 AI 工具,将 Gemini 2.5 Pro 的强大功能带入终端。它提供每分钟 60 次、每天 1000 次的免费请求额度,支持代码生成、调试、自动化任务和多模态处理。安装简单,可通过 npm、npx 或 Homebrew 完成,支持 Google 账号、API Key 和 Vertex AI 三种认证方式。核心功能包括代码理解、自动化集成、Google 搜索和 MCP 服务器扩展。项目可通过 GEMINI.md 文件提供上下文,并能集成到 GitHub
2025-12-09 18:00:00
1134
原创 Claude CLI:下一代AI辅助编程工具的革命性体验
Claude CLI是Anthropic推出的开发者专用AI编程助手,命令行形式,支持npm/yarn全局安装。核心功能含智能代码编辑、项目分析、Git集成、任务管理,高级特性包括MCP服务器扩展、自定义命令、并行任务执行。相比GitHub Copilot等竞品,在代码库理解、文件操作与命令执行上更优,可显著提升开发效率。
2025-12-09 16:00:00
2452
原创 AI代码审查助手Demo
文章摘要: AI代码审查助手利用大语言模型技术实现智能化代码质量检测,相比传统人工审查具有显著优势。系统采用分层架构设计,集成多种AI模型和分析工具,提供代码质量检测、安全漏洞扫描、性能分析等核心功能。技术栈包含Spring Boot、OpenAI SDK和代码分析工具,通过GPT-4等AI模型实现自动化代码审查,可降低随机性设置以提高结果可靠性。该系统能实现秒级代码审查,覆盖全部代码,保持标准统一性,并具备持续学习能力。
2025-11-08 09:00:00
1070
原创 手写Mini Spring框架
本文介绍了一个手写Mini Spring框架的实现过程,旨在帮助开发者深入理解Spring核心原理。框架实现了IoC容器、依赖注入、AOP等核心功能,采用模块化设计包含Bean工厂、应用上下文、AOP代理等组件。通过实现DefaultListableBeanFactory等核心类,演示了Bean生命周期管理、单例缓存、依赖注入等机制,展现了Spring框架的底层设计思想。该实现有助于开发者掌握控制反转和面向切面编程的底层原理,提升框架设计能力。
2025-11-08 09:00:00
1246
原创 Redis在AI向量数据库场景下的高性能实践
Redis作为AI向量数据库的高性能实践 摘要:本文探讨Redis在AI向量数据库场景中的核心应用。Redis凭借内存存储、毫秒级响应和丰富的数据结构,成为向量搜索和RAG系统的理想选择。文章详细解析了Redis向量搜索架构,包括RediSearch、RedisJSON等核心组件,并提供了Spring Boot集成实践方案。重点介绍了向量文档实体设计、索引配置优化以及HNSW算法参数调优等关键技术点,为构建高性能AI应用提供了完整的解决方案框架。通过合理的架构设计和参数配置,Redis能够有效支撑大规模向量
2025-10-14 09:00:00
986
原创 Spring Cloud微服务架构下的AI智能监控与治理实践
本文探讨了Spring Cloud微服务架构中集成AI技术实现智能监控与治理的方法。随着微服务复杂度的提升,传统监控方式已无法满足需求。文章提出了一种结合Spring Cloud与AI技术的架构方案,包含数据采集层、AI分析引擎和智能决策层。核心实现包括智能监控配置、多维度异常检测算法和自动化治理策略,通过AI技术增强异常检测准确性和治理效率。该方案能够应对微服务环境的动态性和复杂性,实现从被动监控到主动预防的转变。
2025-10-14 09:00:00
1071
原创 构建基于Java技术栈的AI Agent系统
本文介绍了使用Java技术栈构建AI Agent系统的完整方案。系统采用分层架构设计,包含Web层、应用层和基础设施层,核心模块包括Agent引擎、知识库和任务编排器。关键技术选型涵盖Spring AI框架、PostgreSQL数据库、Redis缓存、RabbitMQ消息队列和Pinecone向量数据库等组件。系统配置通过Spring Boot实现,包括AI模型参数、数据源连接和监控设置。该方案充分利用了Java生态系统的成熟度,结合Spring Cloud微服务架构,为企业级AI应用提供了高性能、可扩展的
2025-10-09 09:00:00
1294
原创 基于RabbitMQ的AI任务调度与流式处理系统
摘要 本文介绍了基于RabbitMQ构建AI任务调度与流式处理系统的设计方案。系统采用分布式架构,通过RabbitMQ实现任务的高效调度和处理,包含任务分类、队列设计、生产者实现、消费者集群等核心模块。通过优先级队列、死信队列等机制保证任务处理的可靠性和灵活性,支持多种AI任务类型(文本、图像、语音等)的并行处理。系统还提供了资源管理、故障恢复和性能优化等关键功能,能够满足大规模AI推理任务的高并发、低延迟需求。
2025-10-09 09:00:00
988
原创 Spring AI与智能代理模式的深度解析
本文深入解析了Spring AI框架中的智能代理模式实现。文章首先介绍智能代理的概念及其核心特征(感知、决策、执行和学习),然后详细阐述Spring AI的架构设计和核心组件。通过代码示例展示了基础代理接口设计和Spring AI集成实现,包括上下文理解、向量检索和AI模型调用等关键步骤。文章还提供了智能代理系统的实战案例和性能优化建议,为Java开发者构建高效AI代理提供完整解决方案。(149字)
2025-09-30 12:36:05
1340
原创 Java动态代理在Spring AOP中的应用实践
Java动态代理在Spring AOP中的核心应用 本文深入解析Java动态代理机制,重点对比JDK动态代理和CGLIB的实现原理。JDK动态代理基于反射机制,通过Proxy类和InvocationHandler接口在运行时生成代理类,适用于接口代理;而CGLIB通过字节码增强技术实现类代理。在Spring AOP中,两种代理方式根据目标对象类型自动选择:接口优先使用JDK代理,否则采用CGLIB。文章通过代码示例展示了方法拦截器链的实现原理,并分析了两者在性能、适用场景上的差异,为Spring AOP的企
2025-09-30 12:32:30
319
原创 [写的就是真实]EasyExcel + 自定义线程池:万级数据流式读取批量导入更新,性能提升75%!
本文分享了实习期间采用EasyExcel和自定义线程池优化万级数据批量导入的技术方案。通过流式读取Excel数据,结合分批次处理和自定义线程池并行执行,实现了75%的性能提升,有效规避了内存溢出风险。详细介绍了线程池配置、数据模型定义、流式读取监听器实现等核心代码,展示了如何将大数据量处理分解为小批量任务并行执行,最终实现高效稳定的数据导入功能。该方案适用于需要处理大规模Excel数据的场景,具有较好的参考价值。
2025-08-21 09:15:00
928
原创 [写的就是真实]大文件分片上传工具:断点续传+并行加速+秒传优化,性能提升300%!
大文件分片上传技术方案摘要 本文介绍了一种基于Java的企业级大文件上传解决方案,通过分片上传、断点续传和并行加速等技术,实现了性能提升300%、支持TB级文件上传的目标。方案采用Spring Boot框架,结合Redis存储断点信息,实现动态分片策略(5MB-50MB可调)、断点续传管理和秒传校验功能。核心实现包括:1)智能分片服务,根据文件大小动态计算最优分片;2)断点续传服务,利用Redis持久化上传进度;3)并行上传优化,通过自定义线程池加速传输。该方案已成功应用于企业文件管理系统,完美解决大文件上
2025-08-21 09:00:00
742
原创 智能体未来趋势:多智能体协作与通信协议
想知晓 AI 智能体的未来方向?本文聚焦多智能体协作与通信协议。解析工作流编排的核心模式,如提示链、路由、并行等,附 Java 实现代码。介绍 OWL 多智能体协作框架及技术特点,详解 A2A 智能体通信协议的关键要素,对比其与 MCP 协议的差异。助你把握智能体协作化、专业化趋势,洞察未来应用前景。
2025-07-10 09:00:00
1068
原创 智能体高级功能:工具集成与性能优化
想让 AI 智能体更强大高效?本文聚焦智能体高级功能开发。详解工具系统架构,含统一接口设计与管理,附网络搜索、图像搜索等实用工具代码。分享循环检测、上下文优化、超时控制等性能优化策略。还展示专业场景定制实例,助你扩展智能体能力边界,提升其可靠性与用户体验,轻松应对复杂任务。
2025-07-10 09:00:00
1194
原创 从零构建AI智能体:架构设计与代码实现
想亲手打造会思考、能调用工具的 AI 智能体?本文带你从架构到代码实操。解析 OpenManus 分层架构,用 Java 和 Spring AI,从基类到工具调用层逐步实现。含工具开发、循环检测等实用模块,助你掌握核心技术,拥有专属智能体!
2025-07-07 09:00:00
997
原创 AI智能体入门:概念、技术与应用全解析
想了解 AI 智能体的奥秘吗?本文全面解析其概念、技术与应用。从核心架构到工作流程,详解智能体如何感知环境、自主决策。深入剖析 CoT 思维链、Agent Loop 执行循环、ReAct 模式等关键技术,附代码实现。还介绍记忆系统、知识库等支持组件,以及平台使用、开发工具集成、程序调用等应用方式,覆盖客服、数据分析等多场景。无论新手还是开发者,都能快速掌握智能体核心知识。
2025-07-07 09:00:00
1143
原创 3步搞定MCP协议部署!
MCP协议为企业AI系统提供了标准化的工具集成方案,支持本地与远程调用模式,适用于多场景部署。文章深入探讨了其在金融、医疗和制造业的应用策略,并结合Spring框架展示了服务注册、工具开发及安全合规实现。通过合理架构设计、治理规范与性能优化,企业可高效整合AI能力与现有系统,提升业务效率并保障安全性。
2025-06-12 09:00:00
1365
原创 MCP协议安全指南|零基础也能~
MCP协议在提供AI工具调用标准化接口的同时,也面临诸多安全挑战。其设计初衷侧重功能实现而忽视安全性,导致信息不对称、上下文隔离不足、权限验证缺失等隐患。本文系统分析了MCP的安全风险,结合代码审查、环境隔离、网络策略等实践提升安全性,并详解本地、远程及Serverless三种部署模式的应用场景与配置要点,强调安全与便利的平衡。未来需推动协议层深度安全集成与生态治理,确保MCP生态健康发展。
2025-06-12 08:30:00
1455
原创 使用Spring AI和MCP协议构建图片搜索服务
本文介绍如何使用Spring AI与MCP协议构建图片搜索服务,通过封装Pexels API实现AI调用图像资源。内容涵盖项目架构设计、服务端与客户端开发步骤、传输模式配置及部署方案,提升AI应用的多模态处理能力,增强交互实用性。
2025-06-09 09:00:00
1532
原创 MCP协议入门:AI工具调用的标准化接口
MCP协议作为AI工具调用的标准化接口,通过统一工具定义和调用流程,增强AI获取实时信息、执行外部操作及使用专业工具的能力。它简化开发、促进生态共享,助力AI应用突破模型限制,广泛适用于云平台、客户端及程序内调用场景。
2025-06-09 08:45:00
996
原创 对话记忆持久化方案对比与实现:构建可靠的AI会话系统
Spring AI的对话记忆持久化支持内存、文件、数据库三种方案:内存存储高性能但易丢失,适合开发测试;文件存储兼顾持久化与简易性,适合单实例部署;数据库存储高可靠支持分布式,但依赖运维。文章通过性能对比(写入/读取耗时、扩展性等)指导选型,并提供多模态记忆、向量检索、智能摘要等扩展方案,助力构建生产级AI对话系统。
2025-05-22 09:00:00
1128
原创 自定义Advisor机制:打造更智能的AI应用
Spring AI的Advisor机制基于责任链模式,允许开发者在LLM调用链中插入自定义逻辑(如日志记录、违禁词过滤、推理增强),提升应用安全性与智能化水平。其核心接口`CallAroundAdvisor`(同步)和`StreamAroundAdvisor`(流式)通过`getOrder()`控制执行顺序。内置支持对话记忆、知识库检索、向量存储等功能,并可通过实战案例实现情感分析、术语增强等定制化逻辑,结合优先级配置与性能监控,构建高效合规的AI应用。
2025-05-22 08:30:00
1176
原创 GitHub文档加载器设计与实现
GitHub文档加载器可从GitHub仓库加载文件并封装为Document对象,支持单文件/目录递归加载、智能分支回退、文件大小/类型过滤,适用于知识库构建与RAG应用。提供SSL安全测试方案,建议生产环境规范证书验证。核心设计兼顾性能与容错性,助力高效处理开源文档。
2025-05-17 20:51:20
1292
原创 构建下一代AI智能体:基于Spring AI的多轮对话应用
本文介绍了如何基于SpringAI框架构建具备持续记忆能力的多轮对话AI应用。首先,文章详细探讨了Prompt工程的核心要素,包括系统Prompt、用户Prompt和助手Prompt的设计,并提出了优化Prompt的技巧,如明确任务角色、提供详细示例、使用结构化格式等。接着,文章分析了AI需求的三要素:需求来源、需求细化和MVP策略。在应用方案设计部分,文章展示了如何设计系统提示词,并通过SpringAI的ChatClient和Advisors实现多轮对话的记忆持久化。最后,文章通过一个恋爱咨询应用的开发实
2025-05-17 08:30:00
1830
原创 基于Spring AI实现多轮对话系统架构设计
基于SpringAI框架的多轮对话系统设计,涵盖ChatClient、Advisor、ChatMemory等核心组件,探讨链式调用、动态参数绑定、拦截器机制及多种记忆存储方案,助力构建高效、可扩展的对话系统。
2025-05-12 09:00:00
2462
原创 Prompt工程精要与优化策略:让AI更懂你的意图
本文系统介绍了Prompt工程的理论基础、优化技巧及实战应用,旨在帮助开发者提升AI应用的表现力与实用性。文章首先阐述了Prompt工程的核心三角架构,包括系统Prompt、用户Prompt和助手Prompt的协同作用,并提出了三大维度设计方法,涵盖功能型划分、复杂度梯度和开发级别。接着,文章详细介绍了基础提示技巧和进阶提示策略,如思维链提示法和少样本学习,并通过案例分析展示了从普通到专业的Prompt优化过程。此外,文章还探讨了Prompt模板设计与参数化的实现方法。
2025-05-12 08:30:00
919
原创 Spring AI: 为Java应用赋能人工智能
Spring AI 是 Spring 生态系统的一部分,旨在简化 Java 应用中人工智能功能的集成。它通过统一接口支持多个主流 AI 模型提供商,如 OpenAI 和 Google Vertex AI,并强调可移植性和模块化设计。文章详细介绍了 Spring AI 的核心组件、快速入门步骤和高级功能,例如 RAG(检索增强生成)与向量数据库集成。此外,还涵盖了最佳实践、安全性和性能优化策略,并展望了其未来发展。
2025-04-28 08:30:00
1518
原创 AI大模型接入实战:概念、方式与代码详解
AI大模型是指那些拥有超大规模参数的深度学习模型,它们经过海量数据训练,能够处理多模态数据(如文本、图像、音频等),具备逻辑推理和代码编写等"涌现能力"。这些模型通常拥有数十亿甚至数千亿的参数,能够理解复杂指令并生成高质量的内容。OpenAI:提供GPT-4o(多模态)、GPT-4(文本+图像)、GPT-3.5 Turbo等模型Anthropic:推出Claude 3系列模型Google:开发了Gemini Ultra/Pro/Nano系列Meta:开源了Llama 3和Llama 2模型。
2025-04-28 08:30:00
2060
2
原创 深入解析,MyBatis的一二级缓存
MyBatis的二级缓存机制为我们提供了强大的性能优化工具,正确使用可以显著减少数据库访问,提升应用响应速度。一级缓存适用于单会话内的查询优化,无需配置,自动管理二级缓存适用于跨会话的数据共享,需要手动配置,并注意数据一致性问题在实际应用中,应根据业务特性、数据变更频率和一致性要求来选择合适的缓存策略。对于分布式环境,可能需要考虑使用专业的分布式缓存解决方案替代MyBatis原生的二级缓存。正确理解和使用MyBatis的缓存机制,将帮助你在保证数据一致性的同时,最大限度地提升应用性能。
2025-04-07 08:00:00
1611
原创 深入理解STAR法则
STAR是**Situation(情境)、Task(任务)、Action(行动)、Result(结果)**的缩写,是一种结构化描述个人经历或成就的方法论。它通过四个维度的递进式叙述,将复杂的故事转化为清晰、有逻辑的表达,尤其适用于需要突出个人能力的场景。Situation(情境):描述事件发生的背景,包括时间、地点、环境及面临的挑战。Task(任务):明确你的角色和需要完成的目标。Action(行动):具体说明你采取了哪些行动,以及背后的思考逻辑。Result(结果)
2025-04-07 01:38:03
6085
原创 Liquibase:数据库变更版本控制工具 CI/CD
Liquibase是一个开源的数据库版本控制工具,它通过日志文件的形式记录数据库的变更,然后执行这些变更,将数据库更新或回滚到一致的状态。Liquibase支持多种数据库类型,包括MySQL、PostgreSQL、Oracle、SQL Server等。除了使用Liquibase的XML标签,还可以直接执行自定义SQL:</</</</Liquibase为数据库版本控制提供了强大且灵活的解决方案。通过将数据库变更作为代码进行管理,开发团队可以更可靠地跟踪、应用和回滚数据库变更,大大降低了跨环境部署的风险。
2025-03-25 08:15:00
1337
原创 Redis Stack 基础知识-构建现代实时数据平台
Redis Stack 是 Redis 官方推出的一站式解决方案,它整合了 Redis 最先进的模块和功能,为开发者提供了构建实时应用的理想平台。Redis Stack 作为现代实时数据平台,不仅继承了 Redis 的高性能特性,还扩展了其数据处理能力,使其成为构建 AI 应用、实时分析系统和高性能应用的理想选择。结合 Spring AI,Redis Stack 可以轻松实现向量数据库功能,为 RAG 系统和其他 AI 应用提供强大的基础设施支持。
2025-03-25 08:00:00
1336
原创 Java类加载器(ClassLoader)知识点总结
类加载器负责将Class文件(字节码)加载到内存中,转为JVM能够识别的Class对象。Java程序运行时,并不是一次性将所有类加载到内存,而是按需加载。Arthas是阿里巴巴开源的Java诊断工具,它可以帮助开发人员分析生产环境中的各种问题,包括类加载问题。类加载器是Java虚拟机的重要组成部分,它将Java程序的字节码动态加载到内存中。理解类加载器的工作原理和双亲委派模型对于解决类加载相关问题、防止类加载安全漏洞具有重要意义。通过Arthas等工具,我们可以更便捷地分析和解决类加载问题。/ω\
2025-03-05 09:15:00
963
原创 Java 集合框架 基础 - 幽默版
ArrayList是查找小能手LinkedList是增删高手HashSet是去重专家TreeMap是排序达人选对英雄,才能在对应场景下发挥最大战斗力!记住:工具千千万,场景不一般。用对工具事半功,用错工具事倍般。/ω\),支持一下。如果愿意的话关注一下。会对你有更多的帮助。每天都会不定时更新哦 >人<。
2025-03-05 09:00:00
884
原创 JVM初学者指南:Java虚拟机基础知识 笔记
JVM(Java Virtual Machine,Java虚拟机)是运行Java字节码的虚拟机。JVM是Java"一次编写,到处运行"这一特性的关键所在。无论什么平台,只要安装了对应的JVM,就能运行Java程序。跨平台性:Java代码被编译成字节码后,可以在任何安装了JVM的设备上运行自动内存管理:通过垃圾回收机制自动释放不再使用的内存安全性:提供沙箱安全机制,限制Java程序访问本地系统资源JVM是Java生态系统的核心组件,理解JVM的工作原理对于编写高效、稳定的Java应用程序至关重要。
2025-03-03 09:30:00
750
lenyan算法笔记,日常更新自己的笔记而已
2024-03-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅