自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 在RAGFlow中实践Text2SQL

RAGFlow 0.10 正式发布,应广大社区用户要求,引入了Text2SQL特性。

2024-08-29 17:07:41 335

原创 在 RAGFlow 中实践 GraphRAG

RAGFlow 0.9 版本发布,正式引入了对 GraphRAG 的支持。

2024-08-07 15:19:31 946

原创 向量+稀疏向量+全文搜索+张量 = 最佳 RAG 搭配 ?

向量+稀疏向量+全文搜索+张量 = 最佳 RAG 搭配 ?

2024-07-29 16:42:00 736

原创 基于 Infinity 的多路召回评测

Infinity 的最新版本实现了有史以来最全的混合搜索方案,包含向量搜索、全文搜索、稀疏向量搜索,以及张量搜索。那么这些搜索和方案,在实际中使用的效果如何呢?本文来一探究竟。

2024-07-22 18:39:38 571

原创 RAGFlow 正式进入 Agentic 时代

从 0.8 版本开始,RAGFlow 后端提供了完整的基于图的任务编排框架,并且在前端支持无代码方式编辑任务和工作流,正式步入Agentic 时代。

2024-07-09 11:21:05 859

原创 Agentic RAG 与图任务编排

一部分简单场景下,朴素的 RAG 已经可以满足用户意图明确的场景的要求,因为答案已经包含在检索出来的结果中,只要交给 LLM 即可。Agentic RAG 和简单 RAG 的最大区别在于 Agentic RAG 引入了 Agent 的动态编排机制,因此可以根据用户提问的不同意图,引入反馈和查询改写机制,并进行“多跳”式的知识推理,从而实现对复杂提问的回答。如下图所示,Adaptive-RAG 的工作流程与 Self-RAG 类似,只是在前面增加了一个查询分类器,就提供了更多种对话的策略选择。

2024-06-19 12:01:49 566

原创 用RAGFlow快速搭建微信问答机器人

RAGFlow 能够根据不同领域的专业知识库创建垂直领域的 AI 智能问答机器人。问答机器人可以根据知识库中的相关知识回复微信群中客户的提问,同时还可以以原文截图的形式展示被引用的知识库内容。如果你已经有了行业领域知识库,正需要智能客服或者微信问答机器人来基于知识库进行回答,今天的这个教程完全可以满足你的需求

2024-05-30 12:43:55 1372 1

原创 基于RAPTOR实现高质量长上下文的RAG

具体实现中,RAGFlow 在基于Deepdoc 的文档解析预处理阶段完成后,可选择性的打开 RAPTOR 开关进行聚类并生成摘要,随后把这些生成的内容跟原始的 Chunking 结果合并,然后共同送到数据库,分别建立全文索引和向量索引,后续的操作跟常规的 RAG 没有区别。今天我们要讲的是在 RAGFlow 正在开发的版本上 (github main 分支,docker dev tag),针对上面的第三点,提供了的一个实验性功能,就是本文标题所提到的基于 RAPTOR 实现长上下文 RAG。

2024-05-23 18:52:52 1181 1

原创 最快向量搜索! Infinity 0.1.0 正式 release

AI 原生数据库 Infinity 自 2023 年 12 月 21 日正式开源后,又经历了 4 个月的迭代开发,于 4 月 30 日发布了第一个release v0.1.0

2024-05-06 12:01:48 677 1

原创 端到端 RAG 解决方案 RAGFlow 正式开源

继 AI 原生数据库 Infinity 于去年底正式开源之后,我们的端到端 RAG 解决方案 RAGFlow 也于今日正式开源。项目地址: https://github.com/infiniflow/ragflow

2024-04-01 14:49:11 4826 1

原创 能够大海捞针的LLM 会导致 RAG 消亡么?

自从24年2月以来在 AI 领域又连续出了很多重磅的新闻。我们没有蹭热点来对它们做跟踪和评述,一方面是因为目前正在紧锣密鼓的准备 Infinity 第一个release 版本的开发,另一方面,在过去的系列文章里,我们已经对 RAG 的必要性和未来的趋势进行了充分的阐述,相关的总结也在年初 InfoQ 以头条专稿的形式发表(可点原文查看链接)。因此在其余的时间中,我们主要有针对性地选择技术和产品分享观点。今天的文章,正是对这一个多月以来出现的新趋势和观察,给出我们的判断。

2024-03-18 11:49:46 826 1

原创 Sparse Embedding 还是 BM25?

当下的 Embedding 模型,则是在所谓共现的基础之上,解决了表征鲁棒性等等问题,但它们的本质,跟最早的语义定义,并没有本质的区别。而在面向企业的场景中,这些数据的获取会非常困难,Embedding 模型的通用性也远远没有达到足够覆盖的地步,因此,数据库本身的灵活性和可定制性将非常重要,而将数据库成功用于 RAG 实施,也并不是简单的像传统数据库部署完毕由 DBA 接管即可,在 RAG 中,没有 DBA 的存在,只有将数据应用到具体场景和企业的实施,这是件既复杂又有足够高价值的工作。

2024-02-07 13:09:55 1380 1

原创 向量数据库路在何方?结合RAG的发展谈谈它的未来

数据库网红教授 Andy Pavlo 于 2024 年 1 月 4 日他的博客发表了 2023 年度数据库报告,正文开始就是向量数据库的兴起。对于所有数据库从业人员来说,都知道 2023 年是向量数据库的大年,这从 2023 年 3 月英伟达的黄仁勋在 GTC 大会上点名向量数据库开始,到 2023 年 4 月一系列向量数据库的巨额融资都可以感受出来。

2024-01-17 14:12:03 1415

原创 大模型时代为何要新开发一款AI原生数据库

Infinity开源已经两周多,引起了众多爱好者关注。本文是针对社区的一些朋友提出的问题的集中回复

2024-01-09 14:03:51 1390

原创 AI 原生数据库 Infinity 正式开源

Infinity,服务下一代RAG的AI原生数据库,提供高性能的多路融合查询,包含向量搜索,全文搜索以及结构化数据查询,正式开源。项目采用C++ Modules开发,单纯向量搜索的性能超过了所有已知的向量数据库,单响应延迟在0.1毫秒级

2023-12-28 19:39:24 2178 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除