韦东东-CSDN博客

原创为什么你的RAGFlow需要一个 Markdown 预览器（油猴脚本方案）

这篇介绍如何通过利用油猴脚本的脚本注入和跨域请求能力，拦截用户对 .md 链接的点击，通过调用 RAGFlow 的内部 API 获取原始数据，并动态生成一个预览页面；以及在实现上述过程中踩到的坑与迭代方向参考。

2026-04-17 10:39:48 750

原创从 pi-mono 到 OpenClaw：源码拆解，21 万 Star 背后的 Agent 工程减法

OpenClaw 的底层框架 pi-mono 是怎么用四个工具跑赢一众全功能竞品的、OpenClaw 在产品化封装上做了哪些反直觉的工程决策、极简替代品 NanoClaw 又给出了什么不同的答案。同时也会聊聊我对 Agent 生态格局的观察——从 Kimi Claw 到硬件版 Tamagotchi，从 AI Agent 时代的商业模式变革到中国市场的结构性差异。整体是从一个企业大模型应用创业者的工程视角，拆解这几个项目背后共通的减法思维。

2026-04-17 10:39:11 648

原创如何构建基于n8n的RAG日报工作流（手把手教程）

这篇试图说清楚，我在开发这套“RAG 日报”工作流过程中的思考、工具选择、踩过的坑，以及未来的优化计划。

2026-04-10 10:34:15 714

原创我用AutoResearch自主调 YOLO，10 小时提升 6.0%（附 4 个企业级场景的迁移方法论）

Karpathy 的 Autoresearch 到底是什么，为什么它不只是一个自动调参工具；从 V1 到 V2，这套实验循环在硬件、Agent 能力和搜索空间上发生了什么升级；64 轮实验到底是怎么一步一步从超参搜索走到 loss 突破的；以及这些在 YOLO 上验证过的方法，后面又该怎么迁移到 RAG、OCR、Prompt 和代码优化这些更常见的企业场景。

2026-04-10 10:00:06 549

原创 A2A vs. MCP全方位对比（附案例实操详解）

这篇试图说清楚 A2A 的核心定义是啥，其与 MCP 的主要区别，以及 A2A 官方 Demo 复现讲解。

2026-03-31 10:00:03 222

原创用 OpenClaw + 萤石云摄像头实现零成本智能看护：边缘视觉落地解法

萤石云 API 的对接踩坑与能力边界、从像素级帧差到 YOLO 语义检测的技术演进和实测数据、多模态大模型在端侧部署的性能权衡、"YOLO 预筛 → VLM 推理 → 一票否决"的级联架构、解决时效性盲区的投机式预录制、以及 OpenClaw Skill 封装和飞书交互的完整工程实现。

2026-03-31 09:54:25 1017

原创五种RAG分块策略详解 + LlamaIndex代码演示

这篇介绍业界常用的五种 RAG 分块策略核心思想、LlamaIndex 代码演示以及 RAGFlow/Dify 等框架实践思路。

2026-03-31 09:53:36 143

原创 RAGFlow v0.19图文混排：详细拆解+预处理增强案例

这篇介绍RAGFlow v0.19版本图文混合回答功能的底层实现逻辑，和 URL 渲染方案的主要区别，以及如何基于业务语义驱动的PDF 重组案例，在保留 RAGFlow 原生图片显示能力（基于 img_id）的同时，对文档进行更精细化的预处理，特别是针对表格内图片这类复杂场景，以确保分块和图片关联符合预期。

2026-03-30 15:33:00 199

原创拆解一个融了近亿的海外空调报价 AI：ToB AI 产品化的门槛到底在哪里？

Rebar 这个案例背后的工程逻辑和商业模式、暖通行业为什么能跑通产品化而其他行业不行、我做过的水处理报价和家居 CAD 两个项目踩了哪些坑、三个项目放在一起能提炼出什么样的产品化判别框架、这个赛道的竞品格局和真实壁垒在哪里，以及作为 ToB AI 从业者，行业 Know-How 和全球视野为什么可能比技术本身更重要。

2026-03-30 15:31:39 553

原创 Podmiss-免费播客总结产品来了

一周时间，做了款播客总结产品 podmiss.com！

2026-03-19 10:09:10 353

原创 MCP 已死？一个设备运维场景跑完 CLI、MCP、Skills 三种方式后的真实结论

CLI、MCP、Skills 这三种方式到底各自适合什么场景、MCP 的 Token 成本到底有多高（有数据）、怎么用三个问题快速判断该选哪种方式、以及用同一个设备预测性运维场景，分别通过纯 CLI 脚本、MCP Server、OpenClaw Skill 三种原生方式实现后的真实对比。

2026-03-19 10:00:23 1152

原创基于MiniO存储的RAGFlow+Dify图片处理方案

这篇主要介绍基于MiniO存储的RAGFlow+Dify图片处理方案

2026-03-12 13:41:19 396

原创 Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

这篇如何将 Dify 作为主框架使用其 agent 和工作流组件，同时通过 API 调用 RAGFlow 的知识库组件。从而将 Dify 的用户友好界面和工作流能力与 RAGFlow 的深度文档处理能力结合起来。

2026-03-09 08:57:15 953

原创美军用 Claude 打伊朗这件事，几个跟做企业 AI 直接相关的判断

这篇介绍Anthropic 与五角大楼这件事的来龙去脉；Anthropic 的 CEO 为什么自己说模型还远不够可靠，以及这个坦承对做企业 AI 的人意味着什么；Anthropic 划的两条红线和坚持原则这件事在商业上到底有没有回报；以及中美 AI 竞争的加剧，对做应用的人有哪些实际影响。

2026-03-04 10:49:13 526

原创 MinerU vs DeepDoc：集成方案+图片显示优化

这篇以MinerU为由，试图说清楚文档解析工具大致构成，MinerU 和 Deepdoc 对比，MinerU 部署，以及如何和图片服务方案结合使用。

2026-03-03 09:02:33 1116

原创手搓RAG新增功能：递归检索与迭代查询+重回成熟框架API

这篇介绍递归检索与迭代查询，经过初步调试对召回效果有明显提升，这种方法解决了传统 RAG 的几个关键问题：处理复杂多步骤问题：通过多次迭代，分解复杂问题。信息不足的补充：当初始检索结果不足以回答问题时，自动生成补充查询。多角度信息收集：能够从不同角度收集相关信息。

2026-03-02 09:04:25 671

原创 Dify+RAGFLow：基于占位符的图片问答升级方案（最佳实践）

这篇介绍占位符方案如何将图片 URL 幻觉问题，从一个难以控制的“语义幻觉”转变为一个相对更容易处理的“格式遵循”问题，从而极大降低图片显示错误的概率。它不是银弹，但通常是处理富文本（图文混排）RAG 中最实用的工程方法之一。

2026-02-28 15:53:35 724

原创 RAGFlow自动化脚本套件：自定义解析+回答质量评估+参数自动调优

之前文章里详细介绍了 RAGFlow 的 Python api 用法，今天结合几篇法律法规文档来给大家做个简单演示，抛砖引玉。这篇主要介绍三个脚本示例，分别是：数据处理与系统配置，系统测试，参数优化脚本。这套自动化脚本相比 RAGFlow 的 Web 界面提供了三个关键优势。

2026-02-27 09:14:20 965

原创 Text2SQL案例升级：基于Dify工作流的风控策略分析场景拆解

这篇介绍当前主流的几种 Text2SQL 技术范式、信贷风控场景需求分析、工作流的深度拆解，工程化实践与优化方向参考。

2026-02-26 09:16:31 1154

原创 RAG维保案例分享：如何实现“文+图“的答案呈现

本篇以近期实施项目中的一个挖掘机维修场景为例，试图给出一个针对标准化排版PDF 文档（本文演示的固定格式维修手册），使用基于坐标区域截取方法，结合Markdown 语法在回答中显示图片的示例

2026-02-25 09:49:06 849

原创 RAGFlow v0.20的Agent重大更新：text2sql的Agent案例测试

这篇来做个 text2sql 的简单 RAGFlow agent 的案例演示，顺便介绍下这次的主要 Agent 更新特性。选题是来自官方公众号一周前发布的一篇关于 SQL Assistant 的 demo 基础上，优化了数据样例和测试问题，但出现了增加了验证与自修复环节的报错，最后也会对比下在 Dify 上实现效果。

2026-02-05 13:39:40 1082

原创 RAGFlow+DeepSeek-R1:14b落地案例分享（足够详细）：机加工行业设备维保场景

这篇我找了比较熟悉的制造行业案例，分享一个基于 DeepSeek-R1：14B 与 RAGFlow 框架下定制的机械加工工厂的知识库落地case，供大家参考。

2026-02-03 10:03:01 1069

原创本地问答系统升级：本地RAG+网络搜索（已开源）

上篇文章《无需联网！DeepSeek-R1+本地化 RAG，打造私有智能文档助手》，收到了很多来自私信和评论的项目迭代的需求，针对其中提到的联网检索功能，花了半天时间通过集成 SerpAPI 的搜索 API 完成了本地 RAG+联网搜索的功能测试，已在Github开源。项目地址 https://github.com/weiwill88/Local_Pdf_Chat_RAG/tree/main。这篇向各位介绍下使用方法，以及其中的工程优化尝试，欢迎交流。

2026-02-02 09:05:15 901

原创 670次问答、108个负反馈：一个工控知识库POC根因分析与优化方向

这篇如何定义一周 POC 的交付边界的（做什么与刻意不做什么）、POC 阶段的埋点应该记录哪些字段、如何对差评进行根因分析（检索不到、答错、超出范围各占多少）、用户提问有哪些典型的问题模式，以及如何把这些项目经验逐步沉淀为可复用的行业规则库。

2026-01-29 11:22:22 1177

原创对话玉伯：YouMind的前世、今生和未来（内附插画）

本篇介绍YouMind的前世今生

2026-01-28 08:57:06 1051

原创 Agent Skills实战：27个脚本不进上下文，一句话完成RAG入库前文档扫描

这篇介绍Skill 的核心设计理念（渐进式披露）与文件规范、它与 MCP 及多 Agent 的本质区别、如何将现有项目（以数据治理工具包为例）进行 Skill 化改造，以及从投标书生成等长文档场景出发，探讨 Skill 在企业级交付中的产品化潜力。

2026-01-27 14:00:35 1421

原创 DeepSeek蒸馏后小模型，实测具备良好的链式推理，应用场景设想+本地部署步骤

本篇介绍：DeepSeek蒸馏后小模型，实测具备良好的链式推理，应用场景设想+本地部署步骤

2026-01-27 09:35:47 1101

原创 Claude Code Hooks 从入门到实战（附安全检查+代码质量+Git工作流脚本）

这篇介绍Claude Code Hook 的快速扫盲、Hook 运行机制拆解、Hook 配置三要素说明以及三个实用的 Hook 用例参考。

2026-01-26 08:59:46 1389

原创 MinerU2.5源码拆解：双后端架构设计与企业级部署实践

这篇介绍MinerU2.5的性能评测效果、双后端架构设计梳理、核心实现原理源码拆解、部署与许可证注意事项，以及企业集成与扩展参考。

2026-01-23 09:18:03 996

转载 RAG回答不全？上下文扩展+二次重排让召回率从42%提升到89%

RAG回答不完整的根源是切块破坏了语义连贯性。庖丁科技提出的解决方案不改切块规则，而是从检索逻辑入手。Basic模式只做向量检索，召回率42%。Contextual模式加入上下文重排，把候选文本块拼接后整体评估，召回率提升到71%，但初筛遗漏的内容依然找不回来。Expanded模式的核心是"重排-扩展-重排"：第一次重排识别高相关片段，基于分数把前后文纳入候选集，第二次重排对扩展后的内容整体评估。在855个问题的评测中，召回率达到89%。计算成本增加到3.5倍，适合对完整性要求高的长文档场景。

2026-01-23 08:56:36 122

原创做了十几个知识库项目后，我把入库前的文档摸底流程产品化了

这篇介绍这个工具包的三种使用场景，技术选型和第一版功能，在实际使用过程中发现了哪些属于过度开发、哪些应该砍掉，功能收敛之后的设计原则，几个值得展开的技术细节，以及产品体验上的一些打磨。

2026-01-22 16:37:11 1528

原创 Dify+MCP: 泵类设备的预测性维护案例（升级版）

这篇介绍如何使用 Dify 自定义工具实现 MCP 的方法，从而标准化 LLM 与多个数据源的交互方式。

2026-01-22 09:03:02 922

原创 PandaWiki：更轻量的开源知识库，问答效果到底如何？（本地部署教程+效果实测）

这篇试图说清楚：PandaWiki 的手把手本地部署过程、知识库操作流程演示、实际问答效果测试、衍生功能模块盘点等。

2026-01-21 08:57:18 1532

原创企业实施RAG过程中：常见误解与澄清，内含项目升级预告

这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。不过抛开以下细枝末节，个人最大的体感是，做 RAG 的垂直场景落地的关键要素其实一直都不是大模型，怎么把数据检索出来才是问题的根本。简单的向量搜索也只是召回，如何做二次精排，以及插入多样性之后再做一次 Re-Ranking 等等方法也是需要从实践中来到实践中去。

2026-01-20 09:01:06 876