50K star!构建离线的私有GPT,隐私不再泄露

随着越来越多的人使用ChatGPT等AI产品,用户的数据隐私泄露也越来越被重视。

今天我们介绍一个开源项目,它让用户可以在离线的情况下,使用大模型的能力来查询本地文档,不再担心隐私数据泄露,它就是:PrivateGPT

img

PrivateGPT 是什么

PrivateGPT 是一个可立即投入生产的 AI 项目,即使在没有 Internet 连接的情况下,您也可以使用大型语言模型 (LLM) 的功能来询问有关文档的问题。 100% 私有,任何数据都不会离开您的执行环境。

img

PrivateGPT 是一项服务,它将一组 AI RAG 原语包装在一组全面的 API 中,提供私有、安全、可定制且易于使用的 GenAI 开发框架。它支持各种本地和远程的 LLM 提供商、嵌入提供商和向量存储。这些可以轻松更改,而无需更改代码库。

整体架构

它使用FastAPI和LLamaIndex作为其核心框架。这些可以通过更改代码库本身来定制。

该项目提供了一个 API,提供构建私有的、上下文感知的 AI 应用程序所需的所有原语。它遵循并扩展了OpenAI API 标准,支持普通响应和流式响应。API 分为两个逻辑块:

高级 API,抽象了 RAG(检索增强生成)管道实现的所有复杂性:

  • 文档提取:内部管理文档解析、分割、元数据提取、嵌入生成和存储。
  • 使用所提取文档中的上下文进行聊天和完成:抽象上下文检索、提示工程和响应生成。

低级 API,允许高级用户实现自己的复杂管道:

  • 嵌入生成:基于一段文本。
  • 上下文块检索:给定查询,从提取的文档中返回最相关的文本块。

img

除此之外,还提供了一个可用的Gradio UI 客户端来测试 API,以及一组有用的工具,例如批量模型下载脚本、提取脚本、文档文件夹监视等。

安装PrivateGPT

开始安装前需要确认一些基础的环境情况:

ini代码解读复制代码Python =>3.11 
make 
poetry 

对于快速安装可以参考以下的步骤:

bash代码解读复制代码# Clone the repo
git clone <https://github.com/imartinez/privateGPT>
cd privateGPT

# Install Python 3.11
pyenv install 3.11
pyenv local 3.11

# Install dependencies
poetry install --with ui,local

# Download Embedding and LLM models
poetry run python scripts/setup

# (Optional) For Mac with Metal GPU, enable it. Check Installation and Settings section 
to know how to enable GPU on other platforms
CMAKE_ARGS="-DLLAMA_METAL=on" pip install --force-reinstall --no-cache-dir llama-cpp-python

# Run the local server  
PGPT_PROFILES=local make run

# Note: on Mac with Metal you should see a ggml_metal_add_buffer log, stating GPU is 
being used

# Navigate to the UI and try it out! 
<http://localhost:8001/>

为了获得最佳性能,建议使用 GPU 加速。 PrivateGPT 支持与llama.cpp兼容的模型的本地执行。提供了两种运行良好的已知模型来实现无缝设置:

1.TheBloke/Llama-2–7B-chat-GGUF

2.TheBloke/Mistral-7B-Instruct-v0.1-GGUF

使用PrivateGPT

安全完成后可以到 http://localhost:8001/ 访问web服务。

img

它有3种执行模式(可以在左上角选择):

  • 查询文档:使用提取文档中的上下文来回答聊天中发布的问题。它还将之前的聊天消息作为上下文考虑。
  • 在文档中搜索:快速搜索,返回 4 个最相关的文本块及其源文档和页面。
  • LLM 聊天:与 LLM 进行简单、非上下文的聊天。不会考虑提取的文档,只会考虑之前的消息。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值