- 博客(30)
- 收藏
- 关注
原创 通俗易懂搞懂RAG!大模型知识库搭建+本地部署实战(小白零基础)
RAG(检索增强生成)是目前企业AI应用的主流方案,它通过将私有知识库与大模型结合,有效解决AI幻觉问题。文章通俗解释了RAG原理:像给大学生配备专属资料库,提问时先检索相关资料再生成答案。相比微调模型,RAG成本极低、无需修改模型权重、数据更安全,适合处理业务文档、客服问答等场景。文中提供了Python实现代码,仅需8G内存即可搭建本地知识库,支持PDF、Word等多种文档格式。RAG技术门槛低、开发周期短,将成为企业AI落地的核心方案,是开发者必备技能。
2026-05-20 18:14:58
276
原创 Codex 部署、使用教程 & Vibe Coding 实战指南
本文介绍了如何利用OpenAI Codex模型实现VibeCoding(氛围编程)开发模式。主要内容包括:1)Codex本地部署方法,推荐使用开源复刻版codex-local实现私有化部署;2)三种基础使用方式:API调用、IDE插件和Web界面;3)VibeCoding核心四步法:口语化描述需求、生成初始代码、迭代优化和验收;4)实战示例演示如何用自然语言开发Excel数据核对工具;5)提供最佳提示词模板和注意事项。通过Codex+VibeCoding模式,开发者可以用自然语言驱动AI生成代码,大幅提升开
2026-05-20 18:09:42
519
原创 infra-ai模块宏观设计解析:业务与模型之间的中间层核心架构
本文介绍了一个名为infra-ai的中间层模块,旨在解决业务系统与AI模型供应商之间的四大核心问题。该模块通过统一接口标准、支持多模型路由、提供故障转移机制和配置驱动设计,实现了业务层与模型供应商的解耦。模块采用三层架构设计:底层基础设施提供基础支撑,路由核心负责智能调度,能力子系统封装具体AI功能。文章重点阐述了配置驱动、分层接口、路由组件和设计模式四大核心理念,展现了该模块在提升系统可扩展性、维护性和容错性方面的价值。这种设计使得业务系统能够灵活切换模型供应商,同时保证服务的高可用性。
2026-04-29 11:05:00
624
原创 文件上传并发控制:为什么选Redisson可过期信号量?(避坑指南)
文件上传场景下的并发控制策略分析 摘要: 文件上传场景中,传统QPS限流和本地Semaphore方案存在明显缺陷。本文提出基于Redisson可过期信号量(RPermitExpirableSemaphore)的分布式并发控制方案,可有效解决三大核心问题:1)临时文件堆积导致的磁盘空间耗尽;2)高并发上传引发的磁盘IO阻塞;3)对象存储带宽占用造成的网络拥堵。相比传统方案,该方案通过设置带过期时间的分布式信号量,既保证了全局并发控制,又能自动释放异常许可,特别适配长耗时上传场景。建议将过期时间设置为平均耗时的
2026-04-29 10:37:21
611
原创 Claude Code 部署与使用保姆级教程(2026 最新)
Claude Code 是真正的项目级 AI 编程代理,部署只需:准备 Node.js 18+一行命令安装登录 Claude Pro项目目录执行 claude 开始开发适合:快速原型、全栈生成、大型重构、自动化脚本、学习新框架。
2026-04-28 21:15:38
3416
原创 小龙虾 AI(OpenClaw)部署与使用方法(保姆级教程)
小龙虾AI(OpenClaw)是一款本地部署的智能自动化工具,支持Windows/macOS/Linux系统,可通过自然语言指令完成文件管理、浏览器操作等任务。部署需满足Node.js≥22.0.0、Python≥3.9.0等环境要求,提供一键安装脚本。系统支持对接多种AI模型(如阿里云百炼、GPT-4等),并可扩展MCP技能插件。使用时通过控制台输入指令,如"整理桌面文件"或"抓取网页数据生成Excel"。常见问题包括端口冲突、API配置错误等,可通过修改配置或重装
2026-04-28 21:12:33
1342
原创 AI时代,Java程序员要没了?新出路:Java + 大模型应用开发
Java程序员不会消失,只会升级。AI消灭的是重复的“搬砖”工作,而释放出来的创造力需要懂业务、懂工程、懂AI的复合型人才。你手里的Java技能——多线程、JVM调优、分布式事务、微服务治理——依然是AI应用落地时不可替代的硬实力。
2026-04-26 15:16:02
575
原创 Java面试通关宝典:技术面 + HR面全攻略(2025最新版)
【Java面试全攻略】技术面涵盖Java基础(面向对象、集合、并发)、JVM、MySQL、Redis、Spring等核心考点,重点解析HashMap原理、线程池、GC机制、索引优化、分布式锁等高频问题。HR面提供自我介绍、离职原因、职业规划等场景话术模板,强调用项目数据支撑谈薪。面试流程包含技术面3轮+HR面,建议保持双向选择心态,面试后及时复盘。附推荐书单和题库资源,助你系统备战金三银四招聘季。
2026-04-26 15:12:45
561
原创 飞书多维表格完全使用指南:从入门到精通
飞书多维表格是一款低门槛、高上限的生产力工具。通过本文的学习,你应该能够:独立创建一张包含多种字段类型的多维表格切换并使用表格、看板、甘特图、日历等视图实现表间关联、公式计算、自动化消息设置数据权限和制作仪表板把它用到你的工作中,你会发现很多重复的手工统计工作可以被自动化替代,团队协作效率大幅提升。下一步实践任务:就用手边的“个人待办清单”或“家庭购物清单”练手,尝试使用关联和自动化功能。熟练后,你可以挑战搭建一个简单的项目管理系统。欢迎在评论区分享你的使用心得或疑问!
2026-04-24 18:54:03
1565
原创 使用AI编程软件(AI Coding)从0到1实现Java前后端全栈项目
项目名称:BookManager(图书管理系统)功能模块图书列表展示(分页查询)新增图书(书名、作者、价格、库存)编辑图书信息删除图书(逻辑删除)技术栈后端:Spring Boot 2.7.x、MyBatis-Plus、MySQL 8.0、Lombok前端:Vue3、Vite、Element Plus、Axios数据库:MySQLAI工具:Cursor(内置GPT-4)+ 通义灵码(IntelliJ IDEA插件)开发环境效率提升10倍以上:原本一周的工作量压缩到1天(包括学习摸索时间)。
2026-04-24 18:37:15
832
原创 模型容错架构核心要点总结:熔断器+故障转移(附流式调用待解问题)
本文提出了一套模型服务容错方案,核心由三态熔断器和通用故障转移执行器组成。熔断器采用线程安全的ModelHealthStore实现模型级隔离,通过CLOSED-OPEN-HALF_OPEN三态转换机制确保故障隔离和防雪崩。通用执行器通过泛型和函数式接口设计,支持多种模型能力的容错逻辑复用。方案采用双层熔断检查机制,构建了同步调用的完整容错闭环。当前方案已解决同步调用场景的容错问题,但流式调用仍存在"首包探测"等技术难点,需后续专门设计异步数据推送的容错机制。该架构显著提升了模型服务的高可
2026-04-23 11:12:45
585
原创 LeetCode 438. 找到字符串中所有字母异位词(滑动窗口解法,附完整代码)
【摘要】本文详解LeetCode 438题"找到字符串中所有字母异位词"的滑动窗口解法。通过将目标字符串p排序后与s中固定长度的滑动窗口子串排序结果比较,判断是否为异位词。提供完整Java代码,包含详细注释和边界处理,时间复杂度为O(n*mlogm),空间复杂度O(m)。文章验证了两个示例的正确性,并指出可通过哈希表计数优化至O(n)。适合初学者理解滑动窗口应用,代码可直接提交LeetCode通过测试。
2026-04-23 11:08:34
710
原创 从0到1实战:用Cursor Opus4.7模型开发完整软件
从0到1实战:用Cursor Opus4.7模型开发完整软件 新手可跟着步骤一步步操作,快速掌握用Cursor Opus4.7开发软件的方法。AI编程不是“替代开发者”,而是“辅助开发者”,学会借助Opus4.7的优势,专注核心需求和逻辑设计,才能实现高效开发,让编程变得更轻松、更高效!
2026-04-22 18:02:40
946
原创 infra-ai模块宏观设计解析:打通业务与模型供应商的中间层核心架构
《大模型中间层设计:infra-ai模块的架构解析》摘要(149字) 本文解析infra-ai模块如何解决大模型落地中的四大痛点:通过统一接口屏蔽供应商差异,智能路由实现最优模型选择,自动故障转移保障服务连续性,配置驱动降低维护成本。模块采用三层架构设计(业务接口-路由层-供应商适配)和九包分治原则,核心包含模型选择器、健康监测等四大组件,结合策略模式等设计方法提升扩展性。该设计通过配置驱动和标准化接口,有效解耦业务层与供应商,显著降低模型切换与系统维护的复杂度。
2026-04-22 17:41:49
514
原创 SSE 完整链路实战:从协议规范到生产部署(含Spring Boot实战+前端对接)
本文全面解析SSE(Server-Sent Events)技术在大模型流式响应等场景中的应用,提供从协议规范到生产部署的完整解决方案。首先深入剖析SSE协议核心字段与流式响应机制,对比WebSocket突出其单向推送、HTTP原生支持等优势。然后详细讲解SpringBoot服务端三层实现方案(最简版、完整版、生产版),包括SseEmitter机制、心跳保活、连接池管理等关键点。同时提供前端EventSource和fetch两种对接方案,并重点说明Nginx配置(关闭proxy_buffering)和生产环境
2026-04-21 11:08:01
409
原创 零手写代码!用Cursor 10分钟搭建完整Todo待办网站(SpringBoot+Vue3全流程
摘要:本文演示了如何利用Cursor的AI代码生成功能,10分钟内零编码搭建完整的Todo待办网站。采用SpringBoot3+Vue3+MySQL技术栈,全程只需三步:创建空文件、输入提示词、执行命令。后端自动生成10个核心文件,前端生成5个关键文件,包括页面组件和接口调用逻辑。通过双重跨域配置确保前后端联调,最终实现待办事项的增删改查功能。该方法显著提升开发效率,特别适合新手快速构建项目原型,将开发者从重复编码中解放出来,专注于业务逻辑设计。(149字)
2026-04-21 10:27:22
782
原创 Ollama入门必看:核心概念与架构全解析,不用写一行代码也能吃透
Ollama核心概念与架构解析(150字摘要) Ollama采用Client-Server架构,由后台HTTP服务处理模型推理和管理,客户端通过API与之交互。模型管理包含GGUF文件和配置层,默认存储在~/.ollama/models/路径,通过tag机制区分版本。Modelfile支持5种指令实现模型定制,类似Dockerfile原理。提供原生和OpenAI兼容两套API,Java开发者推荐后者以便代码复用。四个关键环境变量(OLLAMA_HOST等)在RAG项目中尤为重要。虽然能自动适配GPU/CPU
2026-04-20 19:21:59
520
原创 RAG实战终章:系统评估与优化,让你的RAG从“能用”到“好用”
RAG系统优化的核心在于建立科学评估体系,避免主观臆断。文章提出分层评估方法:检索阶段关注命中率和排序质量,生成阶段重点监测幻觉率,端到端评估用户满意度。建议采用50-100条覆盖全面的评测数据集,结合LLM-as-Judge实现自动化评估。强调"评估→优化→再评估"的闭环流程,通过量化指标精准定位问题,确保优化效果可验证。最终指出RAG系统需要根据业务需求持续迭代,才能实现从"能用"到"好用"的跨越。
2026-04-20 18:41:30
605
原创 RAG实战进阶:意图识别与问题路由,让你的RAG系统告别“一根筋”
RAG系统中意图识别与问题路由的关键在于精准判断用户需求类型并合理分发处理。文章指出四种核心意图分类(知识检索、工具调用、闲聊对话、引导澄清)和三种实现方案(规则匹配、大模型分类、混合方案),强调混合方案在平衡速度与准确性上的优势。关键要点包括意图识别在RAG链路中的位置(会话记忆后、Query改写前)、兜底策略(默认知识检索路径)以及完整多轮对话处理流程。通过合理设计意图识别系统,可显著提升RAG系统的灵活性和用户体验,避免"一刀切"处理导致的问题。
2026-04-19 19:35:40
657
原创 RAG项目实战:多轮对话记忆设计全解析(5种核心策略+实践指南)
摘要:RAG项目开发中,多轮对话的记忆能力直接影响用户体验。本文解析了5种实用记忆策略:1)完整历史(简单但不可持续);2)滑动窗口(平衡性能与连贯性);3)Token截断(精确控制消耗);4)摘要压缩(保留关键信息);5)混合策略(推荐方案)。同时强调了Token预算分配原则(对话历史占20-30%,检索上下文40-50%)和存储选型建议(开发用内存,生产用Redis)。开发者可根据场景从简单策略入手,逐步优化至混合策略,实现既连贯又高效的对话体验。
2026-04-19 19:02:35
454
原创 LeetCode 11. 盛最多水的容器(Java 双指针详解)
摘要:本文探讨了使用双指针法求解容器盛水问题的算法。给定一个整数数组表示垂线高度,通过初始化左右指针分别指向数组两端,每次计算当前容器容积(宽度×较小高度),并移动高度较小侧的指针以寻找更大容积。该算法时间复杂度为O(n),空间复杂度O(1),相比暴力枚举更高效。文章提供了Java实现代码,并通过示例验证了算法的正确性,指出这是双指针法的经典应用场景,也是面试常见考点。
2026-04-17 17:14:54
162
原创 AI大模型Ragent项目——MCP之官方Java-SDK深度解析
MCP(Model Context Protocol)官方Java SDK是Anthropic主导的开放标准协议实现,为企业级AI工具调用提供标准化方案。该SDK采用模块化设计,包含6个Maven模块,核心架构分为四层:Schema层定义协议消息格式,Transport层处理消息传输(支持Stdio、SSE、StreamableHTTP三种方式),Session层管理连接生命周期,Client/Server层提供开发者API。相比SpringAI的注解封装,直接使用SDK需要手动构建JSON Schema和
2026-04-17 16:38:03
423
原创 Java 实战|基于 Spring AI 快速搭建可被 Claude/Cursor 调用的 MCP Server
本文介绍了基于SpringAIMCPServer快速构建企业知识库助手服务的方法。MCP协议相比传统FunctionCall具有显著优势,通过注解自动生成Schema,支持Stdio/HTTP两种调用方式。文章详细演示了从项目搭建到部署的全流程:1) 使用@Tool注解定义查询年假/订单状态工具;2) 配置MCP服务端;3) 注意事项如禁用Banner输出;4) 打包部署后可直接被Claude等客户端调用。该方案实现了AI工具与Java生态的无缝集成,极大降低了企业级应用开发成本,典型场景下开发效率提升80
2026-04-15 17:20:21
399
原创 【LeetCode】128. 最长连续序列
本文介绍了LeetCode 128题"最长连续序列"的解法。题目要求在未排序数组中找到数字连续的最长序列长度。解法通过TreeSet去重并排序数组,然后遍历有序集合统计连续段长度:若当前元素等于前一个元素+1则计数增加,否则重置计数。最终时间复杂度为O(n)。示例展示了处理过程,代码实现采用Java的TreeSet完成去重排序,通过单次遍历统计最长连续序列长度。
2026-04-15 15:05:43
173
原创 RAG三阶段详解:数据准备,在线检索,与答案生成(附流程图)
RAG(检索增强生成)技术将检索系统与大语言模型结合,通过三阶段流程实现知识问答:1)数据准备阶段将文档分块、向量化并存储到数据库;2)在线检索阶段通过混合检索和重排序获取最相关文本片段;3)答案生成阶段通过结构化Prompt让大模型基于检索内容生成带引用的回答。该架构有效减少幻觉问题,支持知识更新,是目前大模型落地的主流方案。
2026-04-14 17:52:09
604
原创 SpringBoot自动配置原理
主要是一个注解@SpringBootApplication,这是一个复合注解,包含三个注解,分别是@SpringBootConfiguration,@EnableAutoConfiguration,@Component。这个注解通过@Import注解导入对应的配置选择器,读取并加载了META-INFO下面的spring.factories文件中配置的全类名,再根据Conditional条件注解去将这些指定的类加载到Spring容器中。结语:有想要java面试八股文资料的可以关注私信我哦~
2026-04-03 15:53:47
27
1
原创 Mysql中实现隔离级别的底层原理(解释一下MVCC)
不同的隔离级别最终访问的版本是不同的,RC模式下:每次进行读操作时,都会生成一个读视图。RR模式下:在一次事务中,只有在第一次读取的时候生成读视图,之后读的时候会复用这个读视图。版本链:通过roll_pointer字段把多条记录形成一个链,头部保存最旧的数据,尾部保存最新的数据。其中MVCC的意思是多版本并发控制,指维护一个数据的多个版本,其中底层有3个重要部分组成。roll_pointer(回滚指针):指向上一个版本的事务,存储上一个版本的地址。一句话:事务的隔离性是由锁和MVCC(无锁模式)实现的。
2026-03-25 17:24:51
28
原创 MySQL中索引的创建原则以及索引失效的场景
7.如果索引列不能出现NULL值,需要在创建表的时候使用NOT NULL来约束。4.字符串不加单引号,造成索引失效(会类型转换)2.经常作为查询条件的字段或者排序分组的字段。3.不要在索引列上进行运算操作,索引将失效。5.以%开头的模糊查询会造成索引失效。1.数据量较大,且查询比较频繁的表。2.范围查询右边的列,不能使用索引。4.内容较长的话,使用前缀索引。3.字段内容区分度较高。6.需要控制索引的数量。1.违反最左前缀法则。
2026-03-24 20:17:11
26
原创 Redis缓存与数据库数据一致性问题(双写一致性)
在这个xxx项目中的xxx功能中,我们当时采用的阿里的Canal组件实现数据同步,不需要更改业务代码,部署一个Canal服务,Canal服务监听binlog日志文件,当数据库更新之后,Canal服务读取这个日志文件,并把数据发送给消息队列,在消息队列的消费者端接收消息,并且进行缓存的更改业务,如果更新缓存失败,也可以重试执行,保证最终数据的一致性。2.排他锁:写锁writeLock,加锁之后,阻塞其他线程读写操作(底层是setnx,保证只有一个线程执行业务)采用redisson的读写锁。
2026-03-22 16:31:25
99
原创 Git急救手册:误操作拯救指南
误操作影响团队时的沟通流程 多分支环境下的恢复策略 权限控制与保护分支设置建议。清理未跟踪文件的注意事项 利用IDE或系统回收站找回已删除文件。打包特定版本 第三方工具如GitKraken的图形化恢复功能。重写历史 强制推送清理后的仓库后通知所有协作者。保护性别名 定期将本地分支推送到远程备份 使用。强制回退远程分支的条件与风险 利用。重要操作前创建备份分支 设置。检查悬空对象找回被删除内容。创建反向提交安全撤销改动。查找丢失的提交哈希 通过。定位分支最后位置 使用。与预提交钩子的预防措施。
2026-03-22 14:03:29
56
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅