自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

韦东东的博客

专注分享一线RAG落地经验和工程化实践技巧,2025年着重关注有行业Know-how的垂直产业场景应用开发和咨询,欢迎交流。

  • 博客(69)
  • 收藏
  • 关注

原创 如何构建基于n8n的RAG日报工作流(手把手教程)

这篇试图说清楚,我在开发这套“RAG 日报”工作流过程中的思考、工具选择、踩过的坑,以及未来的优化计划。

2026-04-10 10:34:15 688

原创 我用AutoResearch自主调 YOLO,10 小时提升 6.0%(附 4 个企业级场景的迁移方法论)

Karpathy 的 Autoresearch 到底是什么,为什么它不只是一个自动调参工具;从 V1 到 V2,这套实验循环在硬件、Agent 能力和搜索空间上发生了什么升级;64 轮实验到底是怎么一步一步从超参搜索走到 loss 突破的;以及这些在 YOLO 上验证过的方法,后面又该怎么迁移到 RAG、OCR、Prompt 和代码优化这些更常见的企业场景。

2026-04-10 10:00:06 456

原创 A2A vs. MCP全方位对比(附案例实操详解)

这篇试图说清楚 A2A 的核心定义是啥, 其与 MCP 的主要区别,以及 A2A 官方 Demo 复现讲解。

2026-03-31 10:00:03 205

原创 用 OpenClaw + 萤石云摄像头实现零成本智能看护:边缘视觉落地解法

萤石云 API 的对接踩坑与能力边界、从像素级帧差到 YOLO 语义检测的技术演进和实测数据、多模态大模型在端侧部署的性能权衡、"YOLO 预筛 → VLM 推理 → 一票否决"的级联架构、解决时效性盲区的投机式预录制、以及 OpenClaw Skill 封装和飞书交互的完整工程实现。

2026-03-31 09:54:25 888

原创 五种RAG分块策略详解 + LlamaIndex代码演示

这篇介绍业界常用的五种 RAG 分块策略核心思想、LlamaIndex 代码演示以及 RAGFlow/Dify 等框架实践思路。

2026-03-31 09:53:36 116

原创 RAGFlow v0.19图文混排:详细拆解+预处理增强案例

这篇介绍RAGFlow v0.19版本图文混合回答功能的底层实现逻辑,和 URL 渲染方案的主要区别,以及如何基于业务语义驱动的PDF 重组案例,在保留 RAGFlow 原生图片显示能力(基于 img_id)的同时,对文档进行更精细化的预处理,特别是针对表格内图片这类复杂场景,以确保分块和图片关联符合预期。

2026-03-30 15:33:00 169

原创 拆解一个融了近亿的海外空调报价 AI:ToB AI 产品化的门槛到底在哪里?

Rebar 这个案例背后的工程逻辑和商业模式、暖通行业为什么能跑通产品化而其他行业不行、我做过的水处理报价和家居 CAD 两个项目踩了哪些坑、三个项目放在一起能提炼出什么样的产品化判别框架、这个赛道的竞品格局和真实壁垒在哪里,以及作为 ToB AI 从业者,行业 Know-How 和全球视野为什么可能比技术本身更重要。

2026-03-30 15:31:39 519

原创 Podmiss-免费播客总结产品来了

一周时间,做了款播客总结产品 podmiss.com!

2026-03-19 10:09:10 347

原创 MCP 已死?一个设备运维场景跑完 CLI、MCP、Skills 三种方式后的真实结论

CLI、MCP、Skills 这三种方式到底各自适合什么场景、MCP 的 Token 成本到底有多高(有数据)、怎么用三个问题快速判断该选哪种方式、以及用同一个设备预测性运维场景,分别通过纯 CLI 脚本、MCP Server、OpenClaw Skill 三种原生方式实现后的真实对比。

2026-03-19 10:00:23 1018

原创 基于MiniO存储的RAGFlow+Dify图片处理方案

这篇主要介绍基于MiniO存储的RAGFlow+Dify图片处理方案

2026-03-12 13:41:19 376

原创 Dify+RAGFlow:1+1>2的混合架构,详细教程+实施案例

这篇如何将 Dify 作为主框架使用其 agent 和工作流组件,同时通过 API 调用 RAGFlow 的知识库组件。从而将 Dify 的用户友好界面和工作流能力与 RAGFlow 的深度文档处理能力结合起来。

2026-03-09 08:57:15 925

原创 美军用 Claude 打伊朗这件事,几个跟做企业 AI 直接相关的判断

这篇介绍Anthropic 与五角大楼这件事的来龙去脉;Anthropic 的 CEO 为什么自己说模型还远不够可靠,以及这个坦承对做企业 AI 的人意味着什么;Anthropic 划的两条红线和坚持原则这件事在商业上到底有没有回报;以及中美 AI 竞争的加剧,对做应用的人有哪些实际影响。

2026-03-04 10:49:13 519

原创 MinerU vs DeepDoc:集成方案+图片显示优化

这篇以MinerU为由,试图说清楚文档解析工具大致构成,MinerU 和 Deepdoc 对比,MinerU 部署,以及如何和图片服务方案结合使用。

2026-03-03 09:02:33 1068

原创 手搓RAG新增功能:递归检索与迭代查询+重回成熟框架API

这篇介绍递归检索与迭代查询,经过初步调试对召回效果有明显提升,这种方法解决了传统 RAG 的几个关键问题:处理复杂多步骤问题:通过多次迭代,分解复杂问题。信息不足的补充:当初始检索结果不足以回答问题时,自动生成补充查询。多角度信息收集:能够从不同角度收集相关信息。

2026-03-02 09:04:25 658

原创 Dify+RAGFLow:基于占位符的图片问答升级方案(最佳实践)

这篇介绍占位符方案如何将图片 URL 幻觉问题,从一个难以控制的“语义幻觉”转变为一个相对更容易处理的“格式遵循”问题,从而极大降低图片显示错误的概率。它不是银弹,但通常是处理富文本(图文混排)RAG 中最实用的工程方法之一。

2026-02-28 15:53:35 705

原创 RAGFlow自动化脚本套件:自定义解析+回答质量评估+参数自动调优

之前文章里详细介绍了 RAGFlow 的 Python api 用法,今天结合几篇法律法规文档来给大家做个简单演示,抛砖引玉。这篇主要介绍三个脚本示例,分别是:数据处理与系统配置,系统测试,参数优化脚本。这套自动化脚本相比 RAGFlow 的 Web 界面提供了三个关键优势。

2026-02-27 09:14:20 948

原创 Text2SQL案例升级:基于Dify工作流的风控策略分析场景拆解

这篇介绍当前主流的几种 Text2SQL 技术范式、信贷风控场景需求分析、工作流的深度拆解,工程化实践与优化方向参考。

2026-02-26 09:16:31 1118

原创 RAG维保案例分享:如何实现“文+图“的答案呈现

本篇以近期实施项目中的一个挖掘机维修场景为例,试图给出一个针对标准化排版PDF 文档(本文演示的固定格式维修手册),使用基于坐标区域截取方法,结合Markdown 语法在回答中显示图片的示例

2026-02-25 09:49:06 843

原创 RAGFlow v0.20的Agent重大更新:text2sql的Agent案例测试

这篇来做个 text2sql 的简单 RAGFlow agent 的案例演示,顺便介绍下这次的主要 Agent 更新特性。选题是来自官方公众号一周前发布的一篇关于 SQL Assistant 的 demo 基础上,优化了数据样例和测试问题,但出现了增加了验证与自修复环节的报错,最后也会对比下在 Dify 上实现效果。

2026-02-05 13:39:40 1046

原创 RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景

这篇我找了比较熟悉的制造行业案例,分享一个基于 DeepSeek-R1:14B 与 RAGFlow 框架下定制的机械加工工厂的知识库落地case,供大家参考。

2026-02-03 10:03:01 1047

原创 本地问答系统升级:本地RAG+网络搜索(已开源)

上篇文章《无需联网!DeepSeek-R1+本地化 RAG,打造私有智能文档助手》,收到了很多来自私信和评论的项目迭代的需求,针对其中提到的联网检索功能,花了半天时间通过集成 SerpAPI 的搜索 API 完成了本地 RAG+联网搜索的功能测试,已在Github开源。项目地址 https://github.com/weiwill88/Local_Pdf_Chat_RAG/tree/main。这篇向各位介绍下使用方法,以及其中的工程优化尝试,欢迎交流。

2026-02-02 09:05:15 883

原创 670次问答、108个负反馈:一个工控知识库POC根因分析与优化方向

这篇如何定义一周 POC 的交付边界的(做什么与刻意不做什么)、POC 阶段的埋点应该记录哪些字段、如何对差评进行根因分析(检索不到、答错、超出范围各占多少)、用户提问有哪些典型的问题模式,以及如何把这些项目经验逐步沉淀为可复用的行业规则库。

2026-01-29 11:22:22 1161

原创 对话玉伯:YouMind的前世、今生和未来(内附插画)

本篇介绍YouMind的前世今生

2026-01-28 08:57:06 1024

原创 Agent Skills实战:27个脚本不进上下文,一句话完成RAG入库前文档扫描

这篇介绍Skill 的核心设计理念(渐进式披露)与文件规范、它与 MCP 及多 Agent 的本质区别、如何将现有项目(以数据治理工具包为例)进行 Skill 化改造,以及从投标书生成等长文档场景出发,探讨 Skill 在企业级交付中的产品化潜力。

2026-01-27 14:00:35 1386

原创 DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤

本篇介绍:DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤

2026-01-27 09:35:47 1085

原创 Claude Code Hooks 从入门到实战(附安全检查+代码质量+Git工作流脚本)

这篇介绍Claude Code Hook 的快速扫盲、Hook 运行机制拆解、Hook 配置三要素说明以及三个实用的 Hook 用例参考。

2026-01-26 08:59:46 1310

原创 MinerU2.5源码拆解:双后端架构设计与企业级部署实践

这篇介绍MinerU2.5的性能评测效果、双后端架构设计梳理、核心实现原理源码拆解、部署与许可证注意事项,以及企业集成与扩展参考。

2026-01-23 09:18:03 951

转载 RAG回答不全?上下文扩展+二次重排让召回率从42%提升到89%

RAG回答不完整的根源是切块破坏了语义连贯性。庖丁科技提出的解决方案不改切块规则,而是从检索逻辑入手。Basic模式只做向量检索,召回率42%。Contextual模式加入上下文重排,把候选文本块拼接后整体评估,召回率提升到71%,但初筛遗漏的内容依然找不回来。Expanded模式的核心是"重排-扩展-重排":第一次重排识别高相关片段,基于分数把前后文纳入候选集,第二次重排对扩展后的内容整体评估。在855个问题的评测中,召回率达到89%。计算成本增加到3.5倍,适合对完整性要求高的长文档场景。

2026-01-23 08:56:36 104

原创 做了十几个知识库项目后,我把入库前的文档摸底流程产品化了

这篇介绍这个工具包的三种使用场景,技术选型和第一版功能,在实际使用过程中发现了哪些属于过度开发、哪些应该砍掉,功能收敛之后的设计原则,几个值得展开的技术细节,以及产品体验上的一些打磨。

2026-01-22 16:37:11 1502

原创 Dify+MCP: 泵类设备的预测性维护案例 (升级版 )

这篇介绍如何使用 Dify 自定义工具实现 MCP 的方法, 从而标准化 LLM 与多个数据源的交互方式。

2026-01-22 09:03:02 888

原创 PandaWiki:更轻量的开源知识库,问答效果到底如何?(本地部署教程+效果实测)

这篇试图说清楚:PandaWiki 的手把手本地部署过程、知识库操作流程演示、实际问答效果测试、衍生功能模块盘点等。

2026-01-21 08:57:18 1429

原创 企业实施RAG过程中:常见误解与澄清,内含项目升级预告

这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。不过抛开以下细枝末节,个人最大的体感是,做 RAG 的垂直场景落地的关键要素其实一直都不是大模型,怎么把数据检索出来才是问题的根本。简单的向量搜索也只是召回,如何做二次精排,以及插入多样性之后再做一次 Re-Ranking 等等方法也是需要从实践中来到实践中去。

2026-01-20 09:01:06 873

原创 万字长文:说清MCP的前世今生+RAGFlow整合应用示例

这篇讲清:1、从复杂提示词引导模型调用工具开始,到 MCP 作为统一协议标准的变化过程;2、小试牛刀的演示下在传统 RAG 基础上,针对机械加工场景结合 MCP 的一些功能延展示例。

2026-01-19 09:08:26 1235

原创 万元级边缘算力方案:Mac Mini在几个知识库项目的部署实践

这篇介绍模型选型时内存怎么分配、怎么把所有依赖打包做离线部署、Mac Mini 的服务器化改造(防止睡眠、自动登录、开机自启)、网络配置让 IP 保持稳定、远程监控和持续运维的设计思路。最后也聊一些关于边缘算力普惠、知识库应用和大模型落地的思考。

2026-01-16 09:36:18 2366

原创 三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU

这篇主要介绍三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU。

2026-01-15 09:01:24 1250

原创 没有捷径:RAG入门不推荐直接使用成熟框架

这篇以一个开源项目采用简洁的代码展示了 RAG 的完整流程,通过亲手调试这些组件,快速上手。

2026-01-14 10:04:38 1206

原创 27s→1.3s:“小模型 + 知识库”的工业隐患识别技术复盘(全链路)

这篇介绍如何从非结构化的 Word 巡检报告中提取结构化数据、如何构建"隐患描述-法规条款-整改建议"三元组的私有知识库、如何用向量检索让隐患描述精准匹配知识库、如何在 Mac 本地和云端 GPU 两种环境下做性能调优,以及这套"小模型 + 大知识"的技术路线在垂直场景落地的可行性边界。

2026-01-13 09:38:50 948

原创 基于Dify动态解析异构银行流水:架构拆解→风控报告生成

这篇介绍信贷场景的贷前尽调背景、多银行流水的非标特点,以及如何基于 Dify 实现对多源异构银行流水的自动化分析报告生成。

2026-01-12 09:54:36 1199

原创 行业资讯日报自动化:从采集到 LLM 生成的全链路拆解(以政务网站为例)

这篇介绍政府/机构网站的技术架构为什么容易获取、多信息源适配的工程技巧、NocoDB 作为轻量数据库的使用体验、钉钉推送时踩过的坑(图片显示问题、OSS 权限)、LLM 生成日报摘要的 Prompt 设计,以及从本地测试到服务器部署的完整链路。

2026-01-08 16:05:01 1777

原创 Text2SQL案例演示:信贷风控策略场景(Coze工作流版)

这篇介绍信贷风控策略迭代场景的标准流程、Text2SQL 三类技术方案,MVP 版本的 Coze text2sql 工作流,以及对人机协同的一些碎片思考。

2026-01-07 09:13:59 729

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除