自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

韦东东的博客

专注分享一线RAG落地经验和工程化实践技巧,2025年着重关注有行业Know-how的垂直产业场景应用开发和咨询,欢迎交流。

  • 博客(48)
  • 收藏
  • 关注

原创 670次问答、108个负反馈:一个工控知识库POC根因分析与优化方向

这篇如何定义一周 POC 的交付边界的(做什么与刻意不做什么)、POC 阶段的埋点应该记录哪些字段、如何对差评进行根因分析(检索不到、答错、超出范围各占多少)、用户提问有哪些典型的问题模式,以及如何把这些项目经验逐步沉淀为可复用的行业规则库。

2026-01-29 11:22:22 877

原创 对话玉伯:YouMind的前世、今生和未来(内附插画)

本篇介绍YouMind的前世今生

2026-01-28 08:57:06 904

原创 Agent Skills实战:27个脚本不进上下文,一句话完成RAG入库前文档扫描

这篇介绍Skill 的核心设计理念(渐进式披露)与文件规范、它与 MCP 及多 Agent 的本质区别、如何将现有项目(以数据治理工具包为例)进行 Skill 化改造,以及从投标书生成等长文档场景出发,探讨 Skill 在企业级交付中的产品化潜力。

2026-01-27 14:00:35 996

原创 DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤

本篇介绍:DeepSeek蒸馏后小模型,实测具备良好的链式推理,应用场景设想+本地部署步骤

2026-01-27 09:35:47 1045

原创 Claude Code Hooks 从入门到实战(附安全检查+代码质量+Git工作流脚本)

这篇介绍Claude Code Hook 的快速扫盲、Hook 运行机制拆解、Hook 配置三要素说明以及三个实用的 Hook 用例参考。

2026-01-26 08:59:46 1042

原创 MinerU2.5源码拆解:双后端架构设计与企业级部署实践

这篇介绍MinerU2.5的性能评测效果、双后端架构设计梳理、核心实现原理源码拆解、部署与许可证注意事项,以及企业集成与扩展参考。

2026-01-23 09:18:03 785

转载 RAG回答不全?上下文扩展+二次重排让召回率从42%提升到89%

RAG回答不完整的根源是切块破坏了语义连贯性。庖丁科技提出的解决方案不改切块规则,而是从检索逻辑入手。Basic模式只做向量检索,召回率42%。Contextual模式加入上下文重排,把候选文本块拼接后整体评估,召回率提升到71%,但初筛遗漏的内容依然找不回来。Expanded模式的核心是"重排-扩展-重排":第一次重排识别高相关片段,基于分数把前后文纳入候选集,第二次重排对扩展后的内容整体评估。在855个问题的评测中,召回率达到89%。计算成本增加到3.5倍,适合对完整性要求高的长文档场景。

2026-01-23 08:56:36 34

原创 做了十几个知识库项目后,我把入库前的文档摸底流程产品化了

这篇介绍这个工具包的三种使用场景,技术选型和第一版功能,在实际使用过程中发现了哪些属于过度开发、哪些应该砍掉,功能收敛之后的设计原则,几个值得展开的技术细节,以及产品体验上的一些打磨。

2026-01-22 16:37:11 1439

原创 Dify+MCP: 泵类设备的预测性维护案例 (升级版 )

这篇介绍如何使用 Dify 自定义工具实现 MCP 的方法, 从而标准化 LLM 与多个数据源的交互方式。

2026-01-22 09:03:02 814

原创 PandaWiki:更轻量的开源知识库,问答效果到底如何?(本地部署教程+效果实测)

这篇试图说清楚:PandaWiki 的手把手本地部署过程、知识库操作流程演示、实际问答效果测试、衍生功能模块盘点等。

2026-01-21 08:57:18 1068

原创 企业实施RAG过程中:常见误解与澄清,内含项目升级预告

这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。不过抛开以下细枝末节,个人最大的体感是,做 RAG 的垂直场景落地的关键要素其实一直都不是大模型,怎么把数据检索出来才是问题的根本。简单的向量搜索也只是召回,如何做二次精排,以及插入多样性之后再做一次 Re-Ranking 等等方法也是需要从实践中来到实践中去。

2026-01-20 09:01:06 842

原创 万字长文:说清MCP的前世今生+RAGFlow整合应用示例

这篇讲清:1、从复杂提示词引导模型调用工具开始,到 MCP 作为统一协议标准的变化过程;2、小试牛刀的演示下在传统 RAG 基础上,针对机械加工场景结合 MCP 的一些功能延展示例。

2026-01-19 09:08:26 1174

原创 万元级边缘算力方案:Mac Mini在几个知识库项目的部署实践

这篇介绍模型选型时内存怎么分配、怎么把所有依赖打包做离线部署、Mac Mini 的服务器化改造(防止睡眠、自动登录、开机自启)、网络配置让 IP 保持稳定、远程监控和持续运维的设计思路。最后也聊一些关于边缘算力普惠、知识库应用和大模型落地的思考。

2026-01-16 09:36:18 1476

原创 三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU

这篇主要介绍三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU。

2026-01-15 09:01:24 1094

原创 没有捷径:RAG入门不推荐直接使用成熟框架

这篇以一个开源项目采用简洁的代码展示了 RAG 的完整流程,通过亲手调试这些组件,快速上手。

2026-01-14 10:04:38 1167

原创 27s→1.3s:“小模型 + 知识库”的工业隐患识别技术复盘(全链路)

这篇介绍如何从非结构化的 Word 巡检报告中提取结构化数据、如何构建"隐患描述-法规条款-整改建议"三元组的私有知识库、如何用向量检索让隐患描述精准匹配知识库、如何在 Mac 本地和云端 GPU 两种环境下做性能调优,以及这套"小模型 + 大知识"的技术路线在垂直场景落地的可行性边界。

2026-01-13 09:38:50 852

原创 基于Dify动态解析异构银行流水:架构拆解→风控报告生成

这篇介绍信贷场景的贷前尽调背景、多银行流水的非标特点,以及如何基于 Dify 实现对多源异构银行流水的自动化分析报告生成。

2026-01-12 09:54:36 1072

原创 行业资讯日报自动化:从采集到 LLM 生成的全链路拆解(以政务网站为例)

这篇介绍政府/机构网站的技术架构为什么容易获取、多信息源适配的工程技巧、NocoDB 作为轻量数据库的使用体验、钉钉推送时踩过的坑(图片显示问题、OSS 权限)、LLM 生成日报摘要的 Prompt 设计,以及从本地测试到服务器部署的完整链路。

2026-01-08 16:05:01 1523

原创 Text2SQL案例演示:信贷风控策略场景(Coze工作流版)

这篇介绍信贷风控策略迭代场景的标准流程、Text2SQL 三类技术方案,MVP 版本的 Coze text2sql 工作流,以及对人机协同的一些碎片思考。

2026-01-07 09:13:59 659

原创 从“找案例“到“出报价“:一个售前报价Agent案例的7个工程决策

这篇先回顾下项目背景和痛点,然后讲讲如何从 7000 多份历史报价中提炼出 20 种报价模式,接着讲在没有 BOM 表的情况下如何构建 SKU 库,之后是 7 个核心工程决策的详细拆解,再到评测体系的设计,以及为什么不做价格预测,最后是一些通用思路和感想。

2026-01-06 17:06:58 1062

原创 我通过了阿里云高级大模型工程师ACP认证:详细学习攻略(文末抽奖)

这篇介绍阿里云 ACP 课程大纲特色、免费 GPU 实例环境配置、配套学习资源、重点学习章节概览以及习题推荐等。

2026-01-06 08:58:55 1417

原创 一个2B大模型应用创业者的2025:从知乎170+篇回答里筛出的25条行业真相

这篇总结2025年AI基础设施的变革、Agent 从 Demo 到落地的真实进展、企业 AI 转型的困境与出路、行业的共识与分歧以及不同背景从业者的真实声音。

2026-01-05 09:52:13 1167

原创 DeepSeek:R1本地RAG 问答: 功能新增,附 六大关键技术优化路径参考

前一阵介绍的使用 DeepSeek-R1 部署的 7b 模型,在电脑本地进行 RAG 问答的简单演示项目,目前收获了 72 个 star,这篇演示了下升级后的支持多文档上传和多轮问答的功能特性。

2026-01-04 10:00:06 845

原创 从RPA到AI Agent:五种agent模式全解析,搭配2个实践项目介绍(text2SQL、流水解析)

本篇结合个人近期的相关项目或者比赛经验,为大家就其中的五种agent模式应用实践做下分享,正文特意避免了过多技术细节,专注于核心概念和实际案例

2026-01-04 09:59:05 580

原创 DeepSeek开源模型重塑法证审计,个人本地做RAG+微调,25年多试试

这篇来给各位介绍一个基于DeepSeek本地部署模型(或商用 API)的自动化法证邮件分析系统。源码已在Github 开源,项目地址是:https://github.com/weiwill88/Email_audit, 欢迎大家试用后交流。

2026-01-04 09:03:26 718

原创 我的RAG开源项目300+star了,十分适合新手入门(日志级详细拆解)

这篇试图说清楚,RAG项目的各个核心组件构成,日志分段拆解含义,以及进阶和扩展方向参考,欢迎感兴趣的盆友基于此项目进行探索和贡献。

2026-01-04 09:00:55 549

原创 RAGFlow框架优化经验分享(附代码):图文识别+动态分块 、API调优+源码修改

关于选择什么框架的问题这篇以 RAGFlow 框架为例,针对框架选型、核心配置与选型全解析,结合目前团队实践经验,给各位做个分享,大家辨证参考。

2025-12-31 14:12:50 945

原创 企业RAG落地避坑指南:自主开发 vs 三大框架,核心配置与选型全解析

本篇以给一个企业做 RAG 项目咨询的精简版本,使用 Gradio 构建 Web 界面供大家测试使用。作者比较熟悉的 AnythingLLM 为例,从大模型配置、向量数据库选择、Embedder首选项、分块策略等四方面,介绍下配置维度初步推荐。

2025-12-22 09:07:20 1176

原创 无需联网!DeepSeek-R1+本地化RAG,打造私有智能文档助手

我们面对DeepSeek-R1 这样的强思维链模型,除了在官网间或 Chat 一下,如何进一步的将其变成工作或生活场景的生产力工具?本篇试图给出一种基于RAG的回答。

2025-12-22 09:06:33 801

原创 Dify+RAG合同生成:条款级工作流案例拆解

这篇基于业务场景动态生成合同的价值所在、历史合同如何进行预处理得以符合知识库的要求、条款级并行处理的工程实现,以及下一篇涉及复杂跨文档计算的报价单生成内容预告。

2025-12-21 10:24:40 649

原创 基于Bad Cases的Dify合同审查案例演示(工作流拆解)

这篇基于 Dify 工作流和设计的样例数据,向各位展示关于合同审查场景里,利用历史上的“坏案例”(Bad Cases,包含合同原文和审查结果)来辅助新合同的审查,一个可快速上手的解决方案示例。

2025-12-21 10:24:18 779

原创 智能简历筛选案例拆解:基于LlamaIndex+LangChain的框架开发

简历筛选场景的三大核心痛点、包含数据处理流水线、双层知识存储引擎,以及基于 LCEL 对话式 RAG 应用链的核心架构,最后完整的演示下框架化的开发流程并进行效果验证。

2025-12-20 08:24:53 1072

原创 用自定义脚本,解锁RAGFlow中Word复杂表格的终极图文问答

RAGFlow 与 MinerU 在复杂表格处理下的局限性、如何使用 Python-docx 等库实现把每一行表格数据都转化为一个独立且富含上下文的“事实”句子,以及如何可靠的提取单元格图片和存储实现。

2025-12-20 08:24:32 1193

原创 RAGFlow引用机制揭秘:LLM引导与后端验证如何协同工作?

这篇介绍为啥 RAGFlow 的最终回答中的引用显示是后端完成的,LLM 通过提示词引导生成的 [ID:i] 引用标记具体是什么作用,以及这种设计可以参考的工程化经验。

2025-12-19 09:55:12 920

原创 100:1性能优化:基于Manus 看Agent的上下文工程最佳实践

Manus 团队关于构建上下文工程的 Blog 文章,分享的五个工程实践经验。本篇试图在原文章基础上,解释Agent 性能优化的几个核心概念、五个工程实践经验的代码形式解析、复现架构参考,以及工程化经验总结

2025-12-19 09:53:47 1292

原创 Lora微调实操演示(下):五次训练详解(免费GPU)

这篇介绍Lora 微调的环境配置、任务设计、基准测试、五次迭代训练以及微调后的对比测试效果。

2025-12-18 09:03:54 1109

原创 Lora微调实操教程(上):人话版概念详解(附案例)

这篇试图用人话讲清楚:损失函数、代价函数、梯度下降、神经网络、LoRA 微调、学习率等基础的概念和训练过程的逻辑链条。

2025-12-18 09:03:16 1431

原创 TextIn vs. DeepDoc性能测评:RAGFlow解析升级完整教程(附二开代码)

这篇介绍解析工具的开源和商业化产品分类、API 和本地部署的两种调用方式、在三类场景(纯文本、表格、图片)下TextIn与 Deepdoc 的效果对比、TextIn在 RAGFlow中二开的两种实现方式等。

2025-12-17 10:06:03 797

原创 从 1600+ 份 Word 文档到生产级 RAG:一个工控行业知识库的全链路实战复盘

这篇介绍工控行业售后场景的特殊性、为什么选择手搓而不用开源框架、1600 多份 Word 文档的数据清洗与元数据增强、从"搜到了但答错"到高召回率的检索策略迭代、前端从 Streamlit 到 Next.js 的架构升级,以及面向企业级交付的产品化思考等整个项目从需求到交付的全过程。

2025-12-17 10:05:20 838

原创 IBM RAG挑战赛冠军方案全流程复盘 (附源码地址)

这篇以其中第二场的冠军 Ilya Rice 公开 Blog 中分享的构建 RAG 系统过程中遇到的困难、积累的经验和采用的技巧为基础,我按照实际的系统流程(解析、注入、检索、增强、生成)和各位一起拆解学习下。

2025-12-16 08:58:18 1233

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除