Rule-based Retrieval 开源项目使用教程

霍美予Mabel

于 2024-09-13 07:21:50 发布

阅读量854

点赞数 30

本文链接：https://blog.csdn.net/gitblog_00342/article/details/142191392

版权

Rule-based Retrieval 开源项目使用教程

rule-based-retrieval The Rule-based Retrieval package is a Python package that enables you to create and manage Retrieval Augmented Generation (RAG) applications with advanced filtering capabilities. It seamlessly integrates with OpenAI for text generation and Pinecone or Milvus for efficient vector database management. 项目地址: https://gitcode.com/gh_mirrors/ru/rule-based-retrieval

1. 项目介绍

Rule-based Retrieval 是一个 Python 包，旨在帮助用户创建和管理基于规则的检索增强生成（RAG）应用程序。该项目通过高级过滤功能，能够与 OpenAI 进行文本生成无缝集成，并支持 Pinecone 或 Milvus 进行高效的向量数据库管理。

主要功能

高级过滤能力：用户可以定义规则，以精确控制检索过程。
集成 OpenAI：支持与 OpenAI 的文本生成服务集成。
向量数据库管理：支持 Pinecone 和 Milvus 两种向量数据库。

2. 项目快速启动

安装

从 PyPI 安装

pip install rule-based-retrieval

从 GitHub 安装

git clone https://github.com/whyhow-ai/rule-based-retrieval.git
cd rule-based-retrieval
pip install .

快速启动示例

以下是一个简单的示例，展示如何使用 Rule-based Retrieval 包进行文档检索。

from rule_based_retrieval import RuleBasedRetrieval

# 初始化检索对象
retrieval = RuleBasedRetrieval(openai_api_key='your_openai_api_key', pinecone_api_key='your_pinecone_api_key')

# 定义规则
rules = [
    {
        'filename': 'example.pdf',
        'page_numbers': [1, 2, 3],
        'keywords': ['example', 'keyword']
    }
]

# 设置检索参数
query = "这是一个示例查询"
top_k = 5

# 执行检索
results = retrieval.query(query, rules, top_k)

# 输出结果
for result in results:
    print(result)