开源项目Pebblo实战指南-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00471/article/details/142129392

开源项目Pebblo实战指南

pebblo Pebblo enables developers to safely load data and promote their Gen AI app to deployment 项目地址: https://gitcode.com/gh_mirrors/pe/pebblo

项目介绍

Pebblo 是一个专为开发者设计的安全数据加载与Gen AI应用程序部署工具。它确保在不违反企业合规性与安全要求的前提下，使开发者能够无忧地处理敏感数据并推动其AI应用从开发阶段到实际部署。Pebblo通过识别并总结数据中的语义主题和实体，在UI或PDF报告中展示分析结果，提供了一种自我包容的本地化运行方式，非常适合处理受监管和机密的企业级Gen-AI应用数据。

核心组件：

Pebblo Server: 一个集成了话题分类器、实体分类器及报告功能的REST API应用。
Pebblo Semantic Topic Classifier: 分析数据中的语义主题。
Langchain Data SafeLoader: 安全的数据加载器封装。
Pebblo SafeRetriever: 强制执行身份验证与语义规则的检索链，优化向LLM的推断过程。

快速启动

环境准备

确保你的环境中已安装Python 3.x，并准备好pip。

安装Pebblo

使用pip安装（推荐）

终端输入以下命令来安装Pebblo及其依赖：

pip install pebblo --extra-index-url https://packages.daxa.ai/simple/

或者，手动下载最新版本的.whl文件进行安装：

curl -LO "https://packages.daxa.ai/pebblo/0.1.13/pebblo-0.1.13-py3-none-any.whl"
pip install pebblo-0.1.13-py3-none-any.whl

启动Pebblo Server

安装完成后，启动Pebblo服务：

pebblo

此时，Pebblo Server将在本地监听8000端口，准备接受数据片段以供审查和报告。

示例：使用Pebblo SafeLoader加载CSV数据

在你的应用中集成Pebblo SafeLoader：

from langchain.document_loaders.csv_loader import CSVLoader
from langchain_community.document_loaders.pebblo import PebbloSafeLoader

# 初始化CSV Loader
csv_loader = CSVLoader(file_path="your-data-file.csv")

# 使用Pebblo SafeLoader包装，指定应用名称
safe_loader = PebbloSafeLoader(csv_loader, name="example-app")