- 博客(69)
- 收藏
- 关注
原创 如何构建基于n8n的RAG日报工作流(手把手教程)
这篇试图说清楚,我在开发这套“RAG 日报”工作流过程中的思考、工具选择、踩过的坑,以及未来的优化计划。
2026-04-10 10:34:15
688
原创 我用AutoResearch自主调 YOLO,10 小时提升 6.0%(附 4 个企业级场景的迁移方法论)
Karpathy 的 Autoresearch 到底是什么,为什么它不只是一个自动调参工具;从 V1 到 V2,这套实验循环在硬件、Agent 能力和搜索空间上发生了什么升级;64 轮实验到底是怎么一步一步从超参搜索走到 loss 突破的;以及这些在 YOLO 上验证过的方法,后面又该怎么迁移到 RAG、OCR、Prompt 和代码优化这些更常见的企业场景。
2026-04-10 10:00:06
456
原创 A2A vs. MCP全方位对比(附案例实操详解)
这篇试图说清楚 A2A 的核心定义是啥, 其与 MCP 的主要区别,以及 A2A 官方 Demo 复现讲解。
2026-03-31 10:00:03
205
原创 用 OpenClaw + 萤石云摄像头实现零成本智能看护:边缘视觉落地解法
萤石云 API 的对接踩坑与能力边界、从像素级帧差到 YOLO 语义检测的技术演进和实测数据、多模态大模型在端侧部署的性能权衡、"YOLO 预筛 → VLM 推理 → 一票否决"的级联架构、解决时效性盲区的投机式预录制、以及 OpenClaw Skill 封装和飞书交互的完整工程实现。
2026-03-31 09:54:25
888
原创 五种RAG分块策略详解 + LlamaIndex代码演示
这篇介绍业界常用的五种 RAG 分块策略核心思想、LlamaIndex 代码演示以及 RAGFlow/Dify 等框架实践思路。
2026-03-31 09:53:36
116
原创 RAGFlow v0.19图文混排:详细拆解+预处理增强案例
这篇介绍RAGFlow v0.19版本图文混合回答功能的底层实现逻辑,和 URL 渲染方案的主要区别,以及如何基于业务语义驱动的PDF 重组案例,在保留 RAGFlow 原生图片显示能力(基于 img_id)的同时,对文档进行更精细化的预处理,特别是针对表格内图片这类复杂场景,以确保分块和图片关联符合预期。
2026-03-30 15:33:00
169
原创 拆解一个融了近亿的海外空调报价 AI:ToB AI 产品化的门槛到底在哪里?
Rebar 这个案例背后的工程逻辑和商业模式、暖通行业为什么能跑通产品化而其他行业不行、我做过的水处理报价和家居 CAD 两个项目踩了哪些坑、三个项目放在一起能提炼出什么样的产品化判别框架、这个赛道的竞品格局和真实壁垒在哪里,以及作为 ToB AI 从业者,行业 Know-How 和全球视野为什么可能比技术本身更重要。
2026-03-30 15:31:39
519
原创 MCP 已死?一个设备运维场景跑完 CLI、MCP、Skills 三种方式后的真实结论
CLI、MCP、Skills 这三种方式到底各自适合什么场景、MCP 的 Token 成本到底有多高(有数据)、怎么用三个问题快速判断该选哪种方式、以及用同一个设备预测性运维场景,分别通过纯 CLI 脚本、MCP Server、OpenClaw Skill 三种原生方式实现后的真实对比。
2026-03-19 10:00:23
1018
原创 Dify+RAGFlow:1+1>2的混合架构,详细教程+实施案例
这篇如何将 Dify 作为主框架使用其 agent 和工作流组件,同时通过 API 调用 RAGFlow 的知识库组件。从而将 Dify 的用户友好界面和工作流能力与 RAGFlow 的深度文档处理能力结合起来。
2026-03-09 08:57:15
925
原创 美军用 Claude 打伊朗这件事,几个跟做企业 AI 直接相关的判断
这篇介绍Anthropic 与五角大楼这件事的来龙去脉;Anthropic 的 CEO 为什么自己说模型还远不够可靠,以及这个坦承对做企业 AI 的人意味着什么;Anthropic 划的两条红线和坚持原则这件事在商业上到底有没有回报;以及中美 AI 竞争的加剧,对做应用的人有哪些实际影响。
2026-03-04 10:49:13
519
原创 MinerU vs DeepDoc:集成方案+图片显示优化
这篇以MinerU为由,试图说清楚文档解析工具大致构成,MinerU 和 Deepdoc 对比,MinerU 部署,以及如何和图片服务方案结合使用。
2026-03-03 09:02:33
1068
原创 手搓RAG新增功能:递归检索与迭代查询+重回成熟框架API
这篇介绍递归检索与迭代查询,经过初步调试对召回效果有明显提升,这种方法解决了传统 RAG 的几个关键问题:处理复杂多步骤问题:通过多次迭代,分解复杂问题。信息不足的补充:当初始检索结果不足以回答问题时,自动生成补充查询。多角度信息收集:能够从不同角度收集相关信息。
2026-03-02 09:04:25
658
原创 Dify+RAGFLow:基于占位符的图片问答升级方案(最佳实践)
这篇介绍占位符方案如何将图片 URL 幻觉问题,从一个难以控制的“语义幻觉”转变为一个相对更容易处理的“格式遵循”问题,从而极大降低图片显示错误的概率。它不是银弹,但通常是处理富文本(图文混排)RAG 中最实用的工程方法之一。
2026-02-28 15:53:35
705
原创 RAGFlow自动化脚本套件:自定义解析+回答质量评估+参数自动调优
之前文章里详细介绍了 RAGFlow 的 Python api 用法,今天结合几篇法律法规文档来给大家做个简单演示,抛砖引玉。这篇主要介绍三个脚本示例,分别是:数据处理与系统配置,系统测试,参数优化脚本。这套自动化脚本相比 RAGFlow 的 Web 界面提供了三个关键优势。
2026-02-27 09:14:20
948
原创 Text2SQL案例升级:基于Dify工作流的风控策略分析场景拆解
这篇介绍当前主流的几种 Text2SQL 技术范式、信贷风控场景需求分析、工作流的深度拆解,工程化实践与优化方向参考。
2026-02-26 09:16:31
1118
原创 RAG维保案例分享:如何实现“文+图“的答案呈现
本篇以近期实施项目中的一个挖掘机维修场景为例,试图给出一个针对标准化排版PDF 文档(本文演示的固定格式维修手册),使用基于坐标区域截取方法,结合Markdown 语法在回答中显示图片的示例
2026-02-25 09:49:06
843
原创 RAGFlow v0.20的Agent重大更新:text2sql的Agent案例测试
这篇来做个 text2sql 的简单 RAGFlow agent 的案例演示,顺便介绍下这次的主要 Agent 更新特性。选题是来自官方公众号一周前发布的一篇关于 SQL Assistant 的 demo 基础上,优化了数据样例和测试问题,但出现了增加了验证与自修复环节的报错,最后也会对比下在 Dify 上实现效果。
2026-02-05 13:39:40
1046
原创 RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景
这篇我找了比较熟悉的制造行业案例,分享一个基于 DeepSeek-R1:14B 与 RAGFlow 框架下定制的机械加工工厂的知识库落地case,供大家参考。
2026-02-03 10:03:01
1047
原创 本地问答系统升级:本地RAG+网络搜索(已开源)
上篇文章《无需联网!DeepSeek-R1+本地化 RAG,打造私有智能文档助手》,收到了很多来自私信和评论的项目迭代的需求,针对其中提到的联网检索功能,花了半天时间通过集成 SerpAPI 的搜索 API 完成了本地 RAG+联网搜索的功能测试,已在Github开源。项目地址 https://github.com/weiwill88/Local_Pdf_Chat_RAG/tree/main。这篇向各位介绍下使用方法,以及其中的工程优化尝试,欢迎交流。
2026-02-02 09:05:15
883
原创 670次问答、108个负反馈:一个工控知识库POC根因分析与优化方向
这篇如何定义一周 POC 的交付边界的(做什么与刻意不做什么)、POC 阶段的埋点应该记录哪些字段、如何对差评进行根因分析(检索不到、答错、超出范围各占多少)、用户提问有哪些典型的问题模式,以及如何把这些项目经验逐步沉淀为可复用的行业规则库。
2026-01-29 11:22:22
1161
原创 Agent Skills实战:27个脚本不进上下文,一句话完成RAG入库前文档扫描
这篇介绍Skill 的核心设计理念(渐进式披露)与文件规范、它与 MCP 及多 Agent 的本质区别、如何将现有项目(以数据治理工具包为例)进行 Skill 化改造,以及从投标书生成等长文档场景出发,探讨 Skill 在企业级交付中的产品化潜力。
2026-01-27 14:00:35
1386
原创 DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤
本篇介绍:DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤
2026-01-27 09:35:47
1085
原创 Claude Code Hooks 从入门到实战(附安全检查+代码质量+Git工作流脚本)
这篇介绍Claude Code Hook 的快速扫盲、Hook 运行机制拆解、Hook 配置三要素说明以及三个实用的 Hook 用例参考。
2026-01-26 08:59:46
1310
原创 MinerU2.5源码拆解:双后端架构设计与企业级部署实践
这篇介绍MinerU2.5的性能评测效果、双后端架构设计梳理、核心实现原理源码拆解、部署与许可证注意事项,以及企业集成与扩展参考。
2026-01-23 09:18:03
951
转载 RAG回答不全?上下文扩展+二次重排让召回率从42%提升到89%
RAG回答不完整的根源是切块破坏了语义连贯性。庖丁科技提出的解决方案不改切块规则,而是从检索逻辑入手。Basic模式只做向量检索,召回率42%。Contextual模式加入上下文重排,把候选文本块拼接后整体评估,召回率提升到71%,但初筛遗漏的内容依然找不回来。Expanded模式的核心是"重排-扩展-重排":第一次重排识别高相关片段,基于分数把前后文纳入候选集,第二次重排对扩展后的内容整体评估。在855个问题的评测中,召回率达到89%。计算成本增加到3.5倍,适合对完整性要求高的长文档场景。
2026-01-23 08:56:36
104
原创 做了十几个知识库项目后,我把入库前的文档摸底流程产品化了
这篇介绍这个工具包的三种使用场景,技术选型和第一版功能,在实际使用过程中发现了哪些属于过度开发、哪些应该砍掉,功能收敛之后的设计原则,几个值得展开的技术细节,以及产品体验上的一些打磨。
2026-01-22 16:37:11
1502
原创 Dify+MCP: 泵类设备的预测性维护案例 (升级版 )
这篇介绍如何使用 Dify 自定义工具实现 MCP 的方法, 从而标准化 LLM 与多个数据源的交互方式。
2026-01-22 09:03:02
888
原创 PandaWiki:更轻量的开源知识库,问答效果到底如何?(本地部署教程+效果实测)
这篇试图说清楚:PandaWiki 的手把手本地部署过程、知识库操作流程演示、实际问答效果测试、衍生功能模块盘点等。
2026-01-21 08:57:18
1429
原创 企业实施RAG过程中:常见误解与澄清,内含项目升级预告
这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。不过抛开以下细枝末节,个人最大的体感是,做 RAG 的垂直场景落地的关键要素其实一直都不是大模型,怎么把数据检索出来才是问题的根本。简单的向量搜索也只是召回,如何做二次精排,以及插入多样性之后再做一次 Re-Ranking 等等方法也是需要从实践中来到实践中去。
2026-01-20 09:01:06
873
原创 万字长文:说清MCP的前世今生+RAGFlow整合应用示例
这篇讲清:1、从复杂提示词引导模型调用工具开始,到 MCP 作为统一协议标准的变化过程;2、小试牛刀的演示下在传统 RAG 基础上,针对机械加工场景结合 MCP 的一些功能延展示例。
2026-01-19 09:08:26
1235
原创 万元级边缘算力方案:Mac Mini在几个知识库项目的部署实践
这篇介绍模型选型时内存怎么分配、怎么把所有依赖打包做离线部署、Mac Mini 的服务器化改造(防止睡眠、自动登录、开机自启)、网络配置让 IP 保持稳定、远程监控和持续运维的设计思路。最后也聊一些关于边缘算力普惠、知识库应用和大模型落地的思考。
2026-01-16 09:36:18
2366
原创 三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU
这篇主要介绍三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU。
2026-01-15 09:01:24
1250
原创 27s→1.3s:“小模型 + 知识库”的工业隐患识别技术复盘(全链路)
这篇介绍如何从非结构化的 Word 巡检报告中提取结构化数据、如何构建"隐患描述-法规条款-整改建议"三元组的私有知识库、如何用向量检索让隐患描述精准匹配知识库、如何在 Mac 本地和云端 GPU 两种环境下做性能调优,以及这套"小模型 + 大知识"的技术路线在垂直场景落地的可行性边界。
2026-01-13 09:38:50
948
原创 基于Dify动态解析异构银行流水:架构拆解→风控报告生成
这篇介绍信贷场景的贷前尽调背景、多银行流水的非标特点,以及如何基于 Dify 实现对多源异构银行流水的自动化分析报告生成。
2026-01-12 09:54:36
1199
原创 行业资讯日报自动化:从采集到 LLM 生成的全链路拆解(以政务网站为例)
这篇介绍政府/机构网站的技术架构为什么容易获取、多信息源适配的工程技巧、NocoDB 作为轻量数据库的使用体验、钉钉推送时踩过的坑(图片显示问题、OSS 权限)、LLM 生成日报摘要的 Prompt 设计,以及从本地测试到服务器部署的完整链路。
2026-01-08 16:05:01
1777
原创 Text2SQL案例演示:信贷风控策略场景(Coze工作流版)
这篇介绍信贷风控策略迭代场景的标准流程、Text2SQL 三类技术方案,MVP 版本的 Coze text2sql 工作流,以及对人机协同的一些碎片思考。
2026-01-07 09:13:59
729
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅