- 博客(88)
- 收藏
- 关注
原创 实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
目前市场内主流的 RAG 系统技术方案,以文本为主。将 PDF、Word、图片、Excel 等不同格式的文件通过 OCR 解析成文本、表格、图片等数据,通过 chunk 存储到向量数据库。而基于视觉模型的方案反其道而行之,采用类似于 ColPali 框架实现对文档的向量化存储。检索阶段通过相似度得分获取到高关联性的图片,将这些信息喂给视觉模型如 Qwen2.5 VL,视觉模型最终将结果返回给用户。
2025-05-31 13:08:22
846
原创 我们为什么放弃传统RAG?实测案例告诉你,多模态RAG有多强!
传统文本RAG系统在企业落地中面临准确率不足的痛点,主要源于复杂文档中的图片、表格等非文本信息导致的信息丢失。多模态RAG通过融合视觉语言模型(VLM)和文本处理能力,展现出显著优势:1)直接生成图像向量,避免OCR信息损失;2)实现图文语义的深度理解;3)实测在表格提取、文档总结等场景实现精准回复。虽然存在计算资源消耗大的挑战,但问答质量的飞跃式提升使其成为RAG发展的关键方向。KnowFlow团队正在基于ColPali等先进方案研发多模态产品,推动企业知识管理的升级。
2025-05-26 17:22:46
748
原创 DeepSeek 大模型点燃 AI 市场,企业知识库、智能客服成关键落地场景
传统知识库 & 智能客服:通过叠加大模型能力逐步升级。AI Native 方案:直接基于 RAG、Agent 构建,灵活性更高,但仍处市场早期。未来,企业知识库的演进方向包括:✅数据安全与合规—— 确保企业数据隐私,支持私有化部署。✅高准确率—— 结合混合检索与智能推理,提高 AI 回答的正确性。✅多模态支持—— 处理文本、图片、音频等多种数据类型。✅行业深度应用—— 结合具体行业需求,打造高适配度的 AI 解决方案。AI 时代的企业知识库,不仅仅是存储与检索工具,更是推动企业效率提升的重要引擎。
2025-05-04 21:21:38
709
原创 RAGFlow 接入企业微信应用实现原理剖析与最佳实践
受制于篇幅,本文着重介绍了企微应用该场景,事实上企业微信近期还推出了「智能机器人」产品,可以在群聊里提供智能机器人能力。这里就不再展开,有兴趣的同学可以深入交流交流。另外 KnowFlow 发布了 v0.2.0 版本,图文混排能力再度升级,支持自定义分块以及坐标溯源。在保障文档解析和分块效果的前提下准确定位分块在原文档的位置。上述所有源码均已开源,欢迎关注「KnowFlow 企业知识库」获取源码和相互交流。
2025-05-04 21:02:49
1173
原创 RAGFlow 企业知识库团队和权限管理详解
团队和权限管理是企业级知识库必不可少的一个功能,其中 RAGFlow 官方方案提供更加细粒度的权限控制,可以针对指定知识库配置团队的读取/写入/管理权限。在实际客户落地过程中,可以有效帮助客户控制知识库权限问题,避免潜在的信息泄露问题。如官方不开源该功能,我们也可以选择三方的方案,虽然粒度粗了点,但也基本够用。除了团队和权限管理功能以外,接下来我们团队对 RAGFlow 项目要做的是:全新 UI 和交互设计增强结构化输出能力,支持表格、图文混排应用最新的文档 OCR 引擎,如 MinerU。
2025-04-25 11:18:24
1528
2
原创 真实测评!RAGFlow、FastGPT、Dify、QAnything 谁是准确率之王?
在进入测评前,我们简单了解一下 RAG。检索(Retrieval):从知识库中找到与用户问题相关的信息。生成(Generation):基于检索到的信息,利用大语言模型生成答案。这种方式可以大幅提升问答的准确性和相关性,尤其在应对企业知识库场景时表现突出。
2025-04-25 11:14:31
978
原创 RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码,该方案已升级,最新可看专栏)
之前博文中有提到,KnowFlow(基于 RAGFlow 二次开发的商业化产品) 计划要开发以下三个核心功能:重构 RAGFlow 前端页面以及交互进一步增强 RAGFlow 文档解析能力完善 RAGFlow 结构化输出能力,支持图片、表格、图标等输出形式。
2025-04-25 11:07:42
1217
原创 企业知识库图文混排再升级:可视化前端一键解析【已开源】
上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。企业生产环境下知识库管理者通过,效率将会大幅度提升。文档上传完成后,在 RAGFlow 进行问答,便可以。
2025-04-25 10:55:49
549
原创 RAGFlow 企业知识库距离真正的商用,还有多远?
在大模型越来越聪明、上下文长度越来越长的趋势下,RAG 是不是要退出历史舞台?我的回答是恰恰相反:RAG 反而可能会随着技术的进步进一步演化,甚至在某些场景下变得更加重要。因为 RAG 有一些天然的特性是可以和大模型相辅相成的,如知识的时效性、减少计算和存储成本、知识安全可控。未来的趋势可能是超长上下文 和 智能检索双管齐下,以应对不同应用场景的需求,真正的给企业降本增效,进入 AI 时代。最后介绍下我们团队 KnowFlow:基于 RAGFlow 的专注于私有化部署的企业知识库服务商。
2025-04-25 10:25:00
1189
原创 2019零基础学Android第6课——Java代码复用
今天给大家带来的是设计模式的前身,写项目的时候,完成功能模块是最基本的需求,而如何将代码写的更优雅,能适应未来需求的不断变更过,具有极高的可维护性和扩展性,这就是编程的艺术了。组合什么叫做组合?一句话描述:将一个已有的对象引用置于一个新类中。组合是一种较弱的关系,是has-a的关系。看下面代码:public class Animal { private void b...
2019-07-08 09:51:36
238
原创 2019零基础学Android第5课——Java构造器的理解
今天我们来梳理下Java构造器,有地方也称呼为构造方法。有的人可能会说,构造器不就是new个对象用么?这个有什么好研究的呢?等看完本篇对于构造方法的阐述,我们再回头认识下构造方法。最常见的崩溃—空指针新手写代码时候,经常会出现类似这样的一种崩溃,作为新手以后看到这种问题,首先要淡定,因为这种类型的崩溃是最好解决的问题之一。为什么会出现java.lang.Nul...
2019-07-08 09:45:12
346
原创 2019零基础学Android第4课——Java重载和重写
前言关于java的基本操作符和控制语句我这块就直接跳过了。太基础的知识大家可以从下面这个链接去学习:https://www.runoob.com/java/java-tutorial.htmlJava重载和重写初级工程师面试基本上百分百会问的问题之一,我也不知道为啥这两个毫不相关的概念会扯到一块,也不知道是谁发明了这道面试题。既然有人问了,那我们就针对这块来学习下...
2019-07-08 09:39:56
300
原创 2019零基础学Android第3课——Java存储和基本数据类型
很多人可能会问,明明我是开发Android的,为毛要学Java的知识。也有很多初学的朋友说,我java可不可以不学,直接学Android?在此我说下我的理解:Android目前主流的开发语言是java和kotlin,作为开发语言本身,如果你掌握得不够深,也许你依然能够依葫芦画瓢写出程序,但是深入到性能调优、内存泄露时,排查一些由于多线程或引用替换引发的Bug时,你会觉得力不从心,因为你...
2019-07-08 09:37:22
417
原创 2019零基础学Android第2课——创建第一个应用程序
回顾第1课,我们完成了Android开发环境的搭建,我想这时候有很多同学想看看Android的应用程序怎么编译,怎么生成apk,怎么运行在真机或者模拟器上。AS视图AS的视图有以下几个重要的模块: 菜单栏编译,打包,调试,设置等入口 package代码视图 Logcat运行时日志显示 Gradle构建信息显示 那么开始吧,来构...
2019-06-22 22:17:09
611
3
原创 2019零基础学Android第1课——Android开发环境搭建
Android开发环境搭建Android开发工具主要是以AndroidStudio为主,注意如果你在网上还看到有人在介绍eclipse去开发android,那么你可以直接忽略那个介绍了,因为eclipse现在很少有人用了。无论是Google官网的支持力度还是企业的工作需要,我们主要的开发工具是AndroidStudio(简称AS)。什么是IDE?工作过程中可能会有同事问到:你开发的IDE是什...
2019-06-21 14:49:30
3063
原创 2019零基础学Android第0课——零基础怎么学Android?
按照正常逻辑,今天应该是直接进入AndroidStudio开发环境搭建课程了。但我想在写这系列之前,先和一些刚入门的同学一起来探讨下,怎么去学习Android?当今社会大家应该都会有个感受:信息实在太多了,比如你搜下怎么去学习Android,或者Java。你会发现有各种信息扑面而来:报辅导班看视频跟着谷歌官网学多写代码渠道多种多样,信息眼花缭乱,不知道有没有这样的感觉?那怎么去学一门...
2019-06-20 16:18:42
1422
转载 Android 优秀的框架介绍博客
http://blog.csdn.net/liuhongwei123888/article/details/50380368
2016-10-09 14:24:46
350
转载 一个github上不错的工具类分享
一个Nice的Android 工具类,传送门:https://github.com/l123456789jy/Lazy内容说明工具描述AnimationUtils动画工具类AppUtilsAPP相关信息工具类AssetDatabaseOpenHelper目录资源获取Base64加密
2016-07-12 10:46:06
4700
原创 React Native
转载reactNative 优秀的网站:http://reactnative.cn/docs/0.27/getting-started.html#content
2016-07-06 09:41:08
273
转载 优秀的Android CSDN学习博客
http://blog.csdn.net/harvic880925/article/details/39996643
2016-06-13 17:13:13
329
转载 高质量的UI组件下载地址暂存
借花献佛:http://www.oschina.net/project/tag/342/android-ui?lang=0&os=0&sort=view&
2016-05-20 15:49:32
396
转载 【Android inflate 参数 完全诠释】
http://blog.csdn.net/lmj623565791/article/details/38171465
2016-03-22 15:19:14
286
原创 如果你想快速了解androidstudio,那么这个链接请不要错过
传送门:http://segmentfault.com/a/1190000002401964
2016-01-12 11:00:15
337
转载 【读Android源码,提升编码水平之一:图片缓存机制】
偷懒一下,传送门:http://www.cnblogs.com/kissazi2/p/3901369.html
2015-12-21 16:48:36
684
转载 【Android wear 真机开发环境搭建】
http://blog.csdn.net/cooldragon/article/details/42930583
2015-06-05 13:06:15
439
转载 TabHost fragment 和 Viewpager 总结
http://blog.csdn.net/lmj623565791/article/details/24740977
2015-05-11 11:41:23
420
原创 【技术人员市场思维】
某工程招标。一领导家亲戚,找到投标商,比如说5家,和他们说,我帮你搞定,需要收取活动费一百万,但是,也不能说百分百成功,因为各路神通,万一对手找了更高的领导,那也没办法。如果办不成,费用全数退还。然后收了每家一百万,啥事也不做,最后退掉四百万就行了。
2015-04-29 14:48:52
551
转载 关于src 和 drawable 之间的区别以及详细用法
具体的代码就不粘贴了,传送门:http://www.tuicool.com/articles/M3Ujmq
2015-04-20 10:57:45
782
转载 【Android解决HTMI加载图片错位,重叠imageloader】
http://blog.csdn.net/maosidiaoxian/article/details/41673425
2015-02-02 15:31:04
673
转载 【重头学习Adnroid】关于Bitmap drawable byte等的存储问题
一、Bitmap转DrawableBitmap bm=xxx; //xxx根据你的情况获取BitmapDrawable bd=new BitmapDrawable(bm);因为BtimapDrawable是Drawable的子类,最终直接使用bd对象即可。二、 Drawable转Bitmap转成Bitmap对象后,可以将Drawable对象通过Android
2014-12-03 17:19:03
356
原创 【重头学习Android】关于广播的两种方式
众所周知,广播有两种方式:常驻和动态两种前者适合长期驻扎在程序的,后者动态适合临时生成广播。广播其实就是对于,程序内部所有Activity来交互信息的。注册广播(拦截Action)->发送对应Action的广播->onreceive进行处理。通过Action 进行。
2014-12-01 18:47:05
355
原创 【java设计模式之建造者模式和适配器模式】
这里对于建造者模式,不外乎是对于前面的抽象工厂模式批处理,批量生产对象。抽象工厂模式:建立工厂类实现接口产生对象,对象实现类涵盖类方法。好处在于,如果要增加新的类,只需要,再建立一个工厂类new出新类对象,新类实现接口方法。不用更改工厂,实现解耦。适配器模式:分为三种:类,对象,接口的三种适配所谓适配,是为达到某种目标而通过接口进行调整。类的适配:有一个Source类,拥有
2014-11-26 10:39:58
485
转载 【重头学习Android】观察者模式详解
转载http://www.cnblogs.com/hnrainll/archive/2011/12/29/2305582.html在Android中用的比较多的是观察者模式,
2014-11-19 16:10:25
444
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人