- 博客(21)
- 资源 (6)
- 收藏
- 关注
原创 AutoDL 实战指南:构建基于 ComfyUI + SDXL + SAM 的复合 AI 生成与分割环境
本日成功搭建“指尖魔镜”云端AI算力基座。基于RTX 4090环境,部署了ComfyUI可视化编排引擎。核心成果包括:环境闭环:完成PyTorch 2.4与依赖库的兼容性配置,解决版本冲突。模型装填:加载SDXL高清基座与VAE修复模型,确立照片级画质标准。分割就绪:集成Impact-Pack插件(含SAM/YOLO模型),构建“粗定位+精分割”的级联能力。至此,一套具备“指甲精准分割+光影重绘”能力的复合AI生产线已就绪,为后续工作流攻坚奠定坚实基础。
2026-01-13 22:01:30
639
原创 【AI项目实战日记-指尖魔镜】day4 AI工作流攻坚与自动化分割落地
今日攻坚AI核心工作流,成功落地基于ComfyUI的自动化指甲分割方案。通过部署ComfyUI节点式推理引擎,实现了算法链路的模块化编排。技术方案采用MediaPipe手部骨骼检测精确定位指尖坐标,级联SAM万物分割大模型完成像素级抠图。针对边缘融合问题,引入掩码收缩与羽化算法,有效解决了美甲溢色及“贴纸感”痛点。此举不仅实现了零人工干预的选区提取,更为后续的高保真风格迁移与光影重绘打下坚实基础。
2026-01-13 09:32:28
621
原创 【AI项目实战日记-指尖魔镜】day3 算力服务基建与跨服务通讯
今日聚焦算力服务基建,搭建了基于FastAPI的异步算力网关。通过定义统一的JSON通讯契约,实现了Java业务中台与Python算力服务之间的逻辑解耦。在核心AI工作流尚未完全闭环前,利用Mock模式先行打通了“提交任务-状态流转-结果回显”的全链路业务逻辑。同时,引入了基于Header的Token鉴权中间件,为昂贵的GPU算力资源构建了安全屏障。至此,异构系统间的“任督二脉”已调通,项目开发重心正式转向核心AI算法的集成与工作流攻坚。
2026-01-12 10:20:22
609
原创 【AI项目实战日记-指尖魔镜】day2 业务建模与低代码开发
今日顺利完成核心业务建模与自动化部署体系建设。首先,设计了款式库与任务流水核心表,并利用代码生成引擎一键产出前后端CRUD代码,实现业务功能快速落地。其次,引入Docker分层构建技术,将Jar包拆解为依赖层与应用层,显著提升镜像构建与传输效率。最后,打通了基于阿里云ACR镜像仓库的交付链路,配合自动化脚本实现了云服务器的一键发布与开机自启。至此,项目已具备规范的业务管理能力与线上交付标准,为后续AI算力接入打下了坚实基础。
2026-01-12 09:44:17
634
原创 【AI项目实战日记-指尖魔镜】Day1:构建业务数据模型,为“款式管理”和“任务调度”打下地基。
本项目旨在打造AI美甲虚拟试戴SaaS平台,当前处于POC核心验证阶段。今日聚焦基础设施搭建与架构落地:确立双核异构架构:采用“Java负责业务调度、Python负责AI算力”的物理分离模式,实现高并发与重计算解耦,确保系统弹性。落地业务基座:基于Ruoyi-Vue-Pro框架完成模块裁剪与环境初始化,快速复用RBAC权限与OSS底座,大幅缩短开发周期。完成环境闭环:MySQL、Redis及管理后台部署就绪,接口服务调通,为后续AI核心算法接入奠定坚实地基。
2026-01-11 22:26:42
848
原创 【AI实战日记-手搓情感聊天机器人】Day 15 (大结局):一行命令交付!Docker 容器化部署全栈 AI 应用
历经 15 天的硬核开发,Project Echo 终于迎来了最终交付。为了彻底解决“在我电脑上能跑”的环境依赖噩梦,今天我们将引入 Docker 和 Docker Compose。我们将编写多阶段构建的 Dockerfile,配置 Nginx 反向代理,并编排 Backend、Frontend、Redis 三大容器。只需一个 docker-compose up -d 指令,即可在任何服务器上拉起这套包含 RAG、VAD 和多模态交互的完整 AI 系统。
2026-01-11 20:47:20
748
原创 【AI实战日记-手搓情感聊天机器人】Day 14:浏览器里的知心伴侣!基于 Vue3 + FastAPI + Web-VAD 的全栈语音架构
今天是 Phase 5 的第一天,我们不仅要实现前后端分离,还要把 Day 13 的“全自动语音交互”搬到网页上!由于服务器无法直接访问客户端麦克风,架构必须升级。我将在 Vue 3 前端引入 @ricky0123/vad-web(基于 ONNX 的端侧推理模型),实现“浏览器端静默检测”。后端 FastAPI 则升级支持音频文件上传,配合 Whisper 和 LangChain 完成全链路响应。本文将提供完整的架构图解与核心代码实现。
2026-01-10 22:28:20
553
原创 【AI实战日记-手搓情感聊天机器人】Day 13:彻底解放双手!基于 VAD 算法实现 AI 自动静默检测与连续对话
Day 11-12 我们完成了语音的输入输出,但交互方式依然停留在“按键触发”的原始阶段。今天是 Day 13,我们将引入 VAD (语音活动检测) 算法。通过计算音频流的能量阈值 (RMS),让 Project Echo 能够自动判断用户何时开始说话、何时停止说话。我们将重构录音模块,实现 “唤醒 -> 自动聆听 -> 自动静默检测 -> 自动回复” 的全自动闭环,打造真正的 Hands-free 对话体验。
2026-01-10 20:56:51
940
原创 【AI实战日记-手搓情感聊天机器人】Day 12:彻底丢掉键盘!集成 OpenAI Whisper 实现高精度语音识别 (STT)
Day 11 我们实现了语音合成,今天我们将补全多模态交互的另一半拼图——STT (语音转文本)。我将引入 OpenAI 开源的 Whisper 模型(Base版本),它具备惊人的多语言识别能力和抗噪能力。本文将封装一个 AudioRecorder 模块用于麦克风录音,并构建 STTEngine 引擎,实现“听到声音 -> 转化为文字 -> 触发 RAG 对话”的完整闭环。
2026-01-10 19:32:58
536
原创 【AI实战日记-手搓情感聊天机器人】Day 11:让 AI 开口说话!集成 Edge-TTS 实现带情绪的语音合成
今天我们将实现 TTS (文本转语音) 功能,让机器人从“文字聊天”升级为“语音通话”。为了保证效果且控制成本,我选择了 Edge-TTS(微软 Azure 语音的免费接口),它生成的语音极其自然。更重要的是,我将打通 EmotionEngine(情绪引擎) 与 TTS 的连接,根据 AI 的情绪标签([愤怒]/[悲伤])动态调整语速和语调,让声音充满感染力。
2026-01-10 19:05:44
657
原创 【AI实战日记-手搓情感聊天机器人】Day 10:更精准的投喂,防止AI被不确切的信息“迷惑”!使用 Cross-Encoder 实现文档重排序 (Re-ranking)
Day 9 我们通过 Multi-Query 极大提升了检索的广度,但也引入了无关文档的“噪音”。今天是 Day 10,我们将引入 Re-ranking (重排序) 技术,这是 RAG 系统从“可用”迈向“高精度”的关键分水岭。本文将深度解析 Bi-Encoder 与 Cross-Encoder 的区别,并使用 HuggingFace CrossEncoder 构建重排序器,清洗检索结果,确保大模型只看最精准的“干货”。
2026-01-09 08:57:19
846
原创 【AI实战日记-手搓情感聊天机器人】Day 9:拒绝“听不懂”!使用 Multi-Query 实现 RAG 智能多重检索
Day 8 我们实现了文档的批量入库。但在实测中发现,如果用户提问不够精准,RAG 经常检索不到正确内容。今天是 Day 9,我们将对检索链路进行重大升级。我们将引入 LangChain 的 MultiQueryRetriever,利用 LLM 的推理能力,将用户的一个模糊问题自动“裂变”为多个不同角度的精准提问,并行检索,极大提升 RAG 的命中率(Recall)。
2026-01-08 22:29:27
727
原创 【AI实战日记-手搓情感聊天机器人】Day 8:给AI自动投喂知识!构建自动化文档加载与切片流水线 (ETL)
Day 7 我们跑通了 RAG 的最小闭环(手动录入)。今天是 Day 8,我们将解决数据规模化的问题。为了让 AI 能批量阅读本地文件,我们将引入 LangChain Document Loaders 和 Text Splitters,构建一套自动化的 ETL (Extract-Transform-Load) 流水线。我们将实现对本地文件夹的递归扫描,运用 RecursiveCharacterTextSplitter 进行智能分块,并批量向量化入库,让 Project Echo 真正拥有海量知识。
2026-01-08 17:17:29
898
原创 【AI实战日记-手搓情感聊天机器人】Day 7:给 AI 外挂“第二大脑”!RAG 核心之向量数据库 ChromaDB 实战
(1) 计算机本质上是个计算器,它不认识“苹果”这个汉字,它只认识数字。向量化 (Embedding),就是把一段文字(字、词、句子)转换成一串**长长的数字列表(向量)**的过程。你可以把这串数字想象成文字在**“语义宇宙”里的 GPS 坐标**。例子🍎“苹果”的坐标可能是:[0.9, 0.1, -0.5]🍌“香蕉”的坐标可能是:[0.85, 0.2, -0.4]🐱“猫咪”的坐标可能是:[-0.6, 0.8, 0.3]简单来说,就是在 AI 回答问题之前,先去“翻书”。:先去数据库里检索。
2026-01-07 22:48:31
639
原创 【AI实战日记-手搓情感聊天机器人】Day 6:给 AI 装上“记忆体”!使用 Redis 实现对话记忆持久化
前几天的实战中,我们的对话记录都保存在内存(RAM)中,程序重启即丢失。今天是 Day 6,我们将引入工业级缓存数据库 Redis,配合 LangChain Community 的 RedisChatMessageHistory 组件,彻底解决记忆丢失问题。本文将手把手教你使用 Docker 快速部署 Redis,并重构代码实现 Session 级别的持久化存储,让 Project Echo 真正拥有“长期记忆”。
2026-01-07 09:22:28
1029
原创 【AI实战日记-手搓情感聊天机器人】Day 5:给 AI 装上“读心术”!基于通义千问的情绪识别与动态反馈
Day 4 我们解决了“记忆”问题,但机器人依然缺乏“眼力见”,无论我哭还是笑,它的语气都一样。今天是 Day 5,我们将攻克 情绪识别 (Emotion Recognition)。我将利用 通义千问 (Qwen) 强大的逻辑推理能力,构建一个“情绪侦探”中间件。它会在回复前先判断用户的情绪状态(开心/愤怒/悲伤),并利用 LangChain 的 LCEL 特性动态注入 System Prompt,让傲娇酱的回复真正具备温度。
2026-01-06 08:57:20
726
原创 【AI实战日记-手搓情感聊天机器人】Day 4:告别金鱼记忆!LangChain 记忆原理与 Token 成本优化实战
Day 3 我们完成了代码重构。今天是 Day 4,我们将攻克 LLM 应用开发中最基础也最重要的功能——Memory(记忆)。为了解决原生 API 的“无状态”问题,我引入了 LangChain 框架。本文将首先揭示 LangChain 记忆管理的底层原理(4步闭环),随后以架构师的视角指出“全量记忆”带来的 Token 爆炸 隐患,并最终采用 ConversationSummaryBufferMemory(混合摘要记忆) 策略,实现了一个既能记住用户,又能自动压缩历史记录的低成本、高可用记忆系统。
2026-01-05 21:39:43
926
原创 【AI实战日记-手搓情感聊天机器人】Day 3:拒绝“屎山”!重构 Python 工程,为 AI 记忆模块铺路
本文记录了从快速开发转向工程化重构的过程。作者在实现基础对话功能后,暂停新功能开发,专注于代码重构,包括:1) 引入日志系统替代print调试;2) 封装配置单例管理环境变量;3) 规范工程目录结构。重构后的项目分为配置层、核心逻辑层和工具层,使代码更健壮、易维护。通过分离配置与代码、标准化日志、封装核心逻辑,为后续开发打下坚实基础。作者表示下一步将实现LLM的记忆功能,让AI能记住用户信息。
2026-01-04 23:32:03
420
原创 【AI实战日记-手搓情感聊天机器人】Day 2:拒绝机械感!用 Prompt 工程给 AI 注入灵魂
Day 1 我们成功打通了“通信管道”,但目前的机器人说话像个客服。今天是 Day 2,我们将进入 Prompt Engineering(提示词工程)。我将从工程角度解析 System Prompt 的作用,并通过代码将“人设配置”与“业务逻辑”解耦,实现一个可随时切换性格(如:傲娇、温柔、毒舌)的情感机器人。
2026-01-04 15:54:28
831
原创 【AI实战日记-手搓情感聊天机器人】Day 1:15天手搓情感机器人?我的详细路线图与技术选型
本文开启“情感聊天机器人”15天实战(Day 1)。不同于简单Demo,我制定了5阶段工程化路线图:从基础对话、记忆系统、RAG知识库到语音交互及Web部署。项目采用 Python + 阿里通义千问+ LangChain 技术栈。本篇记录Miniconda环境搭建、API配置及基础源码,手把手带你入门大模型应用开发。
2026-01-04 10:21:07
366
原创 【AI开发笔记】最新Miniconda+VSCode安装指南
本文提供2026年最新Miniconda+VSCode安装指南,适用于Windows/macOS/Linux系统。Miniconda作为轻量级Python环境管理工具(仅50MB),配合VSCode编辑器实现高效开发。安装步骤包括:下载对应系统版本的Miniconda并配置PATH;安装VSCode及必备插件(Python、Pylance等);在VSCode中设置Conda环境解释器路径。文章还包含测试方法、常见问题解决方案,并推荐为不同项目创建独立Conda环境。
2026-01-04 10:09:04
1708
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅