- 博客(104)
- 收藏
- 关注
原创 KnowFlow v2.3.5 知识库支持文档 OCR 审阅:OCR 结果终于能改了,RAG 质量管控前移到源头
摘要: KnowFlow v2.3.5针对RAG系统的OCR解析痛点进行了三大优化: OCR审阅环节:新增可视化编辑功能,支持逐页预览、修改Markdown块内容及类型,保留坐标信息确保分块准确性,并实现版本化管理; 标题诊断:内置正则过滤与层级筛选,自动检测误判标题,提供预设模板快速修正; 权限即时生效:通过主动清除Redis缓存,解决RBAC权限变更延迟问题。此外优化了批量权限检查、流式输出速度及图文混排效果。本次升级将质量管控前置,显著提升企业知识库的可控性与落地效率。
2026-03-19 18:35:39
323
原创 中石化“石小勘“落地实践:KnowFlow 如何为大型央企打造智能知识中枢
中国石化研究院基于KnowFlow平台打造了智能助手"石小勘",成功将RAG技术应用于企业知识管理。该系统实现了多格式文档深度解析、图片识别与检索、与Dify生态无缝对接、针对特定文件问答等核心功能,问答准确率达90%。KnowFlow通过开箱即用的企业级RAG引擎,帮助央企将分散的制度文件、科研资料等转化为可对话、可检索的智能知识资产,为大型组织AI转型提供了实践样本。
2026-03-18 10:51:25
334
原创 KnowFlow v2.3.4 发布:当 RAG 学会“深度阅读“,企业知识库的天花板被打破了
KnowFlow v2.3.4创新性地提出"Agentic RAG"架构,通过"先定位-再精读-后作答"的三段式深度阅读机制,解决了传统RAG系统在处理复杂专业文档时"检索到但读不懂"的核心痛点。该系统采用最小Agent设计理念,仅保留检索、精读和页码定位三个关键工具,结合七层原子性分块算法和动态父子分块技术,确保文档结构完整性。同时引入查询澄清机制和异步检索优化,在保证回答质量的前提下提升响应效率。测试显示,该方案可使200页技术文档的查询准确率
2026-03-16 10:39:29
338
原创 Milvus 向量库带来 2.5 倍性能飞跃, Qwen3-VL-Embedding 多模态 RAG 能力全面升级
KnowFlow v2.3.3 正式发布,带来重大性能升级与多模态增强。核心更新包括:1)采用 Milvus 作为默认向量数据库,实测高并发下吞吐量提升 2.5 倍;2)引入 Qwen3-VL-Embedding 实现图文混合检索;3)新增表格内图片提取功能;4)支持钉钉机器人企业集成;5)提供负载均衡部署方案。技术亮点包括独创的"按维度分Collection"架构、统一多模态语义空间、以及完善的弹性伸缩能力,显著提升了复杂文档处理和企业级应用场景下的表现。
2026-02-05 14:53:53
629
原创 2026 年企业级 RAG 多模态技术全景:从文本对齐到端到端融合
2026 年的多模态 RAG 技术已经从实验室走向生产环境。企业不再需要在"能用"和"好用"之间艰难抉择——成熟的技术方案和开箱即用的产品已经就绪。关键在于找到适合自身业务的平衡点:在成本可控的前提下,最大化知识库的价值。无论是从传统方案平滑升级,还是直接采用端到端多模态架构,KnowFlow 都能提供完整的技术支持和实施服务。当你的竞争对手还在为"系统看不懂图"而苦恼时,你的知识库已经能够真正"看见"每一份文档的全部价值。
2026-01-30 15:51:04
1085
原创 KnowFlow v2.3.2 重磅发布:ColPali 多模态解析引领文档理解新纪元
KnowFlow v2.3.2 的发布,标志着我们在企业级知识管理领域又迈出了坚实的一步。从 ColPali 多模态解析到企业微信集成,从 Dify 生态对接到云原生部署,每一项功能都是我们对企业真实需求的回应。我们相信,在 AI 时代,数据治理将成为企业的核心竞争力。KnowFlow 将持续深耕这一领域,为企业提供更可信、更智能、更易用的知识管理解决方案。KnowFlow v2.3.2 现已发布,立即体验 ColPali 多模态解析和企业微信接入的强大能力!关注公众号KnowFlow 企业知识库。
2026-01-16 17:11:15
669
原创 一个程序员团队的 2025:关于创业、知识库,以及不想被定义的人生
《程序员创业记:从技术到产品的知识库实践》摘要: 2025年,一支由4-5名程序员组成的团队基于RAGFlow二次开发了KnowFlow企业知识库产品。团队凭借数据治理经验,瞄准私有化场景下的准确率痛点,通过优化文档解析、分块策略和工程化能力,服务了30+企业用户。从开源社区互动到获得首笔订单,团队完成了从技术执行者到产品决策者的角色转变。文章分享了选择知识库赛道的三大理由、真实企业面临的RAG痛点,以及团队在产品定位、技术取舍和商业化过程中的思考。未来将持续深耕多模态RAG和国产化生态建设。
2025-12-23 14:15:04
638
原创 KnowFlow v2.3.0 重磅发布:适配 RAGFlow v0.22.1 和 MinerU v2.6.5、新增支持多模态视频解析,让知识库“看见“更多
KnowFlow v2.3.0发布,新增多模态视频解析能力,支持视频文件的智能分块与检索。通过五阶段流水线处理:ASR优先转录、关键帧提取、智能切片、VLM描述和Chunk组装,将视频内容转化为结构化数据。核心技术包括Whisper ASR引擎的精确语音识别、关键帧智能提取算法,以及适配RAGFlow和PaddleOCR等组件。该版本标志着KnowFlow正式进入多模态时代,助力企业高效管理视频资产。
2025-12-19 16:56:32
1170
原创 KnowFlow 知识库一键导入导出:打破在线与离线的边界
KnowFlow v2.1.9推出知识库导入导出功能,解决企业离线环境知识管理痛点。该功能支持在线环境利用强大算力完成文档解析、智能分块和向量化处理后,将完整知识库导出为压缩包,通过物理介质快速部署到离线环境。相比传统方式,可降低80%硬件成本,提升5-12倍效率,实现秒级知识库迁移。功能包含完整元数据导出、多模式导入及严格校验机制,适用于金融、制造等需要网络隔离的场景,保障业务连续性和合规要求。测试显示万级文档导入仅需1小时,显著优化企业知识管理全流程。
2025-11-25 15:28:27
499
原创 KnowFlow 牵手百度 PaddleOCR-VL,开启高精度文档解析新时代
KnowFlow v2.1.8 正式发布!本版本最大的亮点是与百度飞桨团队深度合作,集成了业界领先的,为用户带来更高精度的文档解析能力。同时,我们在产品易用性和用户体验方面也做了诸多优化,让企业级知识库管理更加便捷高效。KnowFlow 是专注于的企业级知识库产品,将结构化与非结构化数据治理成对大模型更可信的输入,致力于构建 AI 时代的数据根基。
2025-11-18 18:47:27
513
原创 KnowEval:RAG 工程化的最后一公里,让问答质量有据可依
在 AI 时代,数据质量决定了应用质量。KnowFlow 解决了数据治理的问题,让知识库"可信";KnowEval 解决了质量评测的问题,让 RAG 系统"可控"。数据治理 + 质量保证 = RAG 工程化的完整闭环降低 RAG 应用的开发门槛:从数据准备到质量保证,全流程工具化提升 RAG 应用的质量上限:通过数据驱动优化,持续提升问答效果加速 RAG 应用的落地速度:从几个月缩短到几周甚至几天将结构化与非结构化数据治理成对大模型更可信的输入,构建面向未来的数据治理平台,重塑 AI 时代的数据根基。
2025-11-10 18:05:01
938
原创 多模态 RAG 以文搜图在 RAGFlow 中的实践,自动化测试为 API 质量保驾护航,KnowFlow 全新 UI 重磅来袭
KnowFlow v2.1.6版本发布,带来三大核心更新:1)实现"以文搜图"功能,通过视觉模型增强图片描述并向量化存储;2)全面重构UI设计,采用AI生成的设计规范优化视觉体验和加载性能;3)新增API自动化测试体系,确保80余个接口的稳定性。本次更新还修复了多个技术缺陷,优化了分块检索逻辑和聊天提示词。产品定位聚焦于构建可信数据治理平台,未来将深化与Agent平台的整合并拓展智能数据分析能力。社区版已同步更新至v2.0.8版本。
2025-10-21 11:11:14
1323
原创 RAGFlow 适配 MinerU v2.5.4, 支持 vlm 和 pipline 双模式;MinerU/Dots 无缝接入 RAGFlow,新增父子、语义、标题、正则切片方法
摘要:RAGFlow适配MinerUv2.5.4,支持vlm和pipline双模式,新增父子、语义、标题、正则切片方法。架构设计采用解析器与分块方法分离,提升复用性和维护性。优化了RBAC权限检查,响应速度从700ms提升至200ms,并修复了坐标映射等问题。MinerUv2.5.4识别效果显著,支持自动跨页表格合并。未来将聚焦多模态开发,实现图文搜索功能。开源社区版已更新至v2.0.8。
2025-10-10 17:19:37
1766
2
原创 RAGFlow 全面接入 MinerU 2.0,支持 pipeline、vlm-transformers、vlm-sglang 三种模式,解析精度大幅度提升
KnowFlow v1.0.0正式接入MinerU 2.0,主要解决原架构耦合度高、部署困难的问题,并显著提升文档OCR识别准确率。新版支持三种部署模式,重点推荐vlm-sglang-client模式,在单卡4090上可达10,000+tokens/s的吞吐量。项目采用组件化设计,提供轻量级和完整版Docker镜像,并开放源码方便二次开发。开发者发烧期间仍坚持完成版本发布,强调开源项目的价值在于技术分享与社区认可。未来计划继续深入RAGFlow源码解读、开源前端代码,并通过视频平台推广项目。
2025-06-30 11:45:27
4672
原创 RAGFlow 插件支持自定义正则分块、Excel 分块增强
RAGFlow 插件最新版本优化了文档分块功能,新增自定义正则分块策略,支持前端配置分块参数。作为RAGFlow的兼容扩展项目,重点解决企业场景落地问题。针对Excel处理,改进解析策略,动态计算分块大小并优化合并单元格处理,但保留行列关联问题待后续检索专题解决。未来计划接入MinerU 2.0并转向Docker服务架构,后续将聚焦源码解读与混合检索等核心功能。该项目已开源,欢迎社区交流。
2025-06-23 11:00:42
1681
原创 RAGFlow Markdown 文件分块支持 AST 智能分块,检索效果显著增强
新版本提供三种分块策略:Basic方案保持简单高效;SmartAST方案通过AST解析实现语义分块,平均422token,兼顾质量和性能;标题驱动方案适合层级化文档,平均504token。同时增强了微信/企业微信的三方接入能力,支持自动创建独立会话。测试表明智能分块策略显著提升检索效果,但文档解析尤其是表格识别仍有改进空间。未来将聚焦文档识别优化和Excel分块增强,持续提升RAG系统准确率。
2025-06-23 10:53:58
1679
原创 实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
目前市场内主流的 RAG 系统技术方案,以文本为主。将 PDF、Word、图片、Excel 等不同格式的文件通过 OCR 解析成文本、表格、图片等数据,通过 chunk 存储到向量数据库。而基于视觉模型的方案反其道而行之,采用类似于 ColPali 框架实现对文档的向量化存储。检索阶段通过相似度得分获取到高关联性的图片,将这些信息喂给视觉模型如 Qwen2.5 VL,视觉模型最终将结果返回给用户。
2025-05-31 13:08:22
1010
原创 我们为什么放弃传统RAG?实测案例告诉你,多模态RAG有多强!
传统文本RAG系统在企业落地中面临准确率不足的痛点,主要源于复杂文档中的图片、表格等非文本信息导致的信息丢失。多模态RAG通过融合视觉语言模型(VLM)和文本处理能力,展现出显著优势:1)直接生成图像向量,避免OCR信息损失;2)实现图文语义的深度理解;3)实测在表格提取、文档总结等场景实现精准回复。虽然存在计算资源消耗大的挑战,但问答质量的飞跃式提升使其成为RAG发展的关键方向。KnowFlow团队正在基于ColPali等先进方案研发多模态产品,推动企业知识管理的升级。
2025-05-26 17:22:46
918
原创 DeepSeek 大模型点燃 AI 市场,企业知识库、智能客服成关键落地场景
传统知识库 & 智能客服:通过叠加大模型能力逐步升级。AI Native 方案:直接基于 RAG、Agent 构建,灵活性更高,但仍处市场早期。未来,企业知识库的演进方向包括:✅数据安全与合规—— 确保企业数据隐私,支持私有化部署。✅高准确率—— 结合混合检索与智能推理,提高 AI 回答的正确性。✅多模态支持—— 处理文本、图片、音频等多种数据类型。✅行业深度应用—— 结合具体行业需求,打造高适配度的 AI 解决方案。AI 时代的企业知识库,不仅仅是存储与检索工具,更是推动企业效率提升的重要引擎。
2025-05-04 21:21:38
853
原创 RAGFlow 接入企业微信应用实现原理剖析与最佳实践
受制于篇幅,本文着重介绍了企微应用该场景,事实上企业微信近期还推出了「智能机器人」产品,可以在群聊里提供智能机器人能力。这里就不再展开,有兴趣的同学可以深入交流交流。另外 KnowFlow 发布了 v0.2.0 版本,图文混排能力再度升级,支持自定义分块以及坐标溯源。在保障文档解析和分块效果的前提下准确定位分块在原文档的位置。上述所有源码均已开源,欢迎关注「KnowFlow 企业知识库」获取源码和相互交流。
2025-05-04 21:02:49
2109
原创 RAGFlow 企业知识库团队和权限管理详解
团队和权限管理是企业级知识库必不可少的一个功能,其中 RAGFlow 官方方案提供更加细粒度的权限控制,可以针对指定知识库配置团队的读取/写入/管理权限。在实际客户落地过程中,可以有效帮助客户控制知识库权限问题,避免潜在的信息泄露问题。如官方不开源该功能,我们也可以选择三方的方案,虽然粒度粗了点,但也基本够用。除了团队和权限管理功能以外,接下来我们团队对 RAGFlow 项目要做的是:全新 UI 和交互设计增强结构化输出能力,支持表格、图文混排应用最新的文档 OCR 引擎,如 MinerU。
2025-04-25 11:18:24
4279
4
原创 真实测评!RAGFlow、FastGPT、Dify、QAnything 谁是准确率之王?
在进入测评前,我们简单了解一下 RAG。检索(Retrieval):从知识库中找到与用户问题相关的信息。生成(Generation):基于检索到的信息,利用大语言模型生成答案。这种方式可以大幅提升问答的准确性和相关性,尤其在应对企业知识库场景时表现突出。
2025-04-25 11:14:31
1709
原创 RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码,该方案已升级,最新可看专栏)
之前博文中有提到,KnowFlow(基于 RAGFlow 二次开发的商业化产品) 计划要开发以下三个核心功能:重构 RAGFlow 前端页面以及交互进一步增强 RAGFlow 文档解析能力完善 RAGFlow 结构化输出能力,支持图片、表格、图标等输出形式。
2025-04-25 11:07:42
3869
原创 企业知识库图文混排再升级:可视化前端一键解析【已开源】
上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。企业生产环境下知识库管理者通过,效率将会大幅度提升。文档上传完成后,在 RAGFlow 进行问答,便可以。
2025-04-25 10:55:49
1064
原创 RAGFlow 企业知识库距离真正的商用,还有多远?
在大模型越来越聪明、上下文长度越来越长的趋势下,RAG 是不是要退出历史舞台?我的回答是恰恰相反:RAG 反而可能会随着技术的进步进一步演化,甚至在某些场景下变得更加重要。因为 RAG 有一些天然的特性是可以和大模型相辅相成的,如知识的时效性、减少计算和存储成本、知识安全可控。未来的趋势可能是超长上下文 和 智能检索双管齐下,以应对不同应用场景的需求,真正的给企业降本增效,进入 AI 时代。最后介绍下我们团队 KnowFlow:基于 RAGFlow 的专注于私有化部署的企业知识库服务商。
2025-04-25 10:25:00
2016
原创 2019零基础学Android第6课——Java代码复用
今天给大家带来的是设计模式的前身,写项目的时候,完成功能模块是最基本的需求,而如何将代码写的更优雅,能适应未来需求的不断变更过,具有极高的可维护性和扩展性,这就是编程的艺术了。组合什么叫做组合?一句话描述:将一个已有的对象引用置于一个新类中。组合是一种较弱的关系,是has-a的关系。看下面代码:public class Animal { private void b...
2019-07-08 09:51:36
274
原创 2019零基础学Android第5课——Java构造器的理解
今天我们来梳理下Java构造器,有地方也称呼为构造方法。有的人可能会说,构造器不就是new个对象用么?这个有什么好研究的呢?等看完本篇对于构造方法的阐述,我们再回头认识下构造方法。最常见的崩溃—空指针新手写代码时候,经常会出现类似这样的一种崩溃,作为新手以后看到这种问题,首先要淡定,因为这种类型的崩溃是最好解决的问题之一。为什么会出现java.lang.Nul...
2019-07-08 09:45:12
379
原创 2019零基础学Android第4课——Java重载和重写
前言关于java的基本操作符和控制语句我这块就直接跳过了。太基础的知识大家可以从下面这个链接去学习:https://www.runoob.com/java/java-tutorial.htmlJava重载和重写初级工程师面试基本上百分百会问的问题之一,我也不知道为啥这两个毫不相关的概念会扯到一块,也不知道是谁发明了这道面试题。既然有人问了,那我们就针对这块来学习下...
2019-07-08 09:39:56
319
原创 2019零基础学Android第3课——Java存储和基本数据类型
很多人可能会问,明明我是开发Android的,为毛要学Java的知识。也有很多初学的朋友说,我java可不可以不学,直接学Android?在此我说下我的理解:Android目前主流的开发语言是java和kotlin,作为开发语言本身,如果你掌握得不够深,也许你依然能够依葫芦画瓢写出程序,但是深入到性能调优、内存泄露时,排查一些由于多线程或引用替换引发的Bug时,你会觉得力不从心,因为你...
2019-07-08 09:37:22
441
原创 2019零基础学Android第2课——创建第一个应用程序
回顾第1课,我们完成了Android开发环境的搭建,我想这时候有很多同学想看看Android的应用程序怎么编译,怎么生成apk,怎么运行在真机或者模拟器上。AS视图AS的视图有以下几个重要的模块: 菜单栏编译,打包,调试,设置等入口 package代码视图 Logcat运行时日志显示 Gradle构建信息显示 那么开始吧,来构...
2019-06-22 22:17:09
655
3
原创 2019零基础学Android第1课——Android开发环境搭建
Android开发环境搭建Android开发工具主要是以AndroidStudio为主,注意如果你在网上还看到有人在介绍eclipse去开发android,那么你可以直接忽略那个介绍了,因为eclipse现在很少有人用了。无论是Google官网的支持力度还是企业的工作需要,我们主要的开发工具是AndroidStudio(简称AS)。什么是IDE?工作过程中可能会有同事问到:你开发的IDE是什...
2019-06-21 14:49:30
3360
原创 2019零基础学Android第0课——零基础怎么学Android?
按照正常逻辑,今天应该是直接进入AndroidStudio开发环境搭建课程了。但我想在写这系列之前,先和一些刚入门的同学一起来探讨下,怎么去学习Android?当今社会大家应该都会有个感受:信息实在太多了,比如你搜下怎么去学习Android,或者Java。你会发现有各种信息扑面而来:报辅导班看视频跟着谷歌官网学多写代码渠道多种多样,信息眼花缭乱,不知道有没有这样的感觉?那怎么去学一门...
2019-06-20 16:18:42
1488
转载 Android 优秀的框架介绍博客
http://blog.csdn.net/liuhongwei123888/article/details/50380368
2016-10-09 14:24:46
370
转载 一个github上不错的工具类分享
一个Nice的Android 工具类,传送门:https://github.com/l123456789jy/Lazy内容说明工具描述AnimationUtils动画工具类AppUtilsAPP相关信息工具类AssetDatabaseOpenHelper目录资源获取Base64加密
2016-07-12 10:46:06
4793
原创 React Native
转载reactNative 优秀的网站:http://reactnative.cn/docs/0.27/getting-started.html#content
2016-07-06 09:41:08
292
转载 优秀的Android CSDN学习博客
http://blog.csdn.net/harvic880925/article/details/39996643
2016-06-13 17:13:13
342
转载 高质量的UI组件下载地址暂存
借花献佛:http://www.oschina.net/project/tag/342/android-ui?lang=0&os=0&sort=view&
2016-05-20 15:49:32
409
转载 【Android inflate 参数 完全诠释】
http://blog.csdn.net/lmj623565791/article/details/38171465
2016-03-22 15:19:14
302
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅