PDF 文件创建聊天机器人-pdf-chatbot

概述

gpt4-pdf-chatbot-langchain是可以为您的 PDF 文件创建聊天机器人。

发展

  1. 克隆回购 

git clone [github https url]
2.安装包
pnpm install
3.
  1. 设置你的.env文件
  • 复制.env.example.env 您的.env文件中应该如下所示:
OPENAI_API_KEY=

PINECONE_API_KEY=

PINECONE_ENVIRONMENT=

PINECONE_INDEX_NAME=
  • 访问openai以检索 API 密钥并插入到您的.env文件中。
  • 访问pinecone以创建和检索您的 API 密钥,还可以从仪表板检索您的环境和索引名称。
  1. config文件夹中,将 替换为运行时您希望在 Pinecone 上存储嵌入的PINECONE_NAME_SPACE位置。该命名空间稍后将用于查询和检索。namespacepnpm run ingest

  2. utils/makechain.ts链中更改QA_PROMPT您自己的用例。如果您无权访问 ,请更改modelName为。请在此存储库之外验证您是否有权访问,否则该应用程序将无法使用它。new OpenAIChatgpt-3.5-turbogpt-4gpt-4

将您的 PDF 文件转换为嵌入

这个 repo 可以加载多个 PDF 文件

  1. 在文件夹内docs,添加您的 pdf 文件或包含 pdf 文件的文件夹。

  2. 运行脚本npm run ingest以“摄取”并嵌入您的文档。如果您遇到错误,请在下方进行故障排除。

  3. 检查 Pinecone 仪表板以验证您的命名空间和向量是否已添加。

运行应用

确认嵌入和内容已成功添加到 Pinecone 后,您可以运行该应用程序pnpm run dev以启动本地开发环境,然后在聊天界面中输入问题。

故障排除

通常,请留意此 repo 的issues和部分以获取解决方案。discussions

一般错误

  • 确保您运行的是最新的 Node 版本。跑步node -v
  • 尝试使用不同的 PDF 或先将 PDF 转换为文本。您的 PDF 可能已损坏、已扫描或需要 OCR 才能转换为文本。
  • Console.log变量env并确保它们被公开。
  • 确保您使用与此存储库相同版本的 LangChain 和 Pinecone。
  • 检查您是否创建了.env包含有效(且有效)API 密钥、环境和索引名称的文件。
  • 如果您更改,modelNameOpenAIChat注意替代模型的正确名称是gpt-3.5-turbo
  • gpt-4如果您决定使用,请确保您有权访问。在 repo 之外测试你的 openAI 密钥,确保它能正常工作,并且你有足够的 API 积分。
  • 检查您的全局环境中是否没有多个 OPENAPI 密钥。env如果这样做,项目中的本地文件将被系统env变量覆盖。
  • 尝试将您的 API 密钥硬编码到process.env变量中。

Pinecone 错误

  • 确保您的Pinecone 仪表板environment与和文件index中的仪表板相匹配。pinecone.ts.env
  • 检查您是否已将矢量维度设置为1536
  • 确保你的 pinecone 命名空间是小写的。
  • Starter(免费)计划用户的 Pinecone 索引在 7 天不活动后被删除。为防止这种情况,请向 Pinecone 发送 API 请求以在 7 天之前重置计数器。
  • 使用新的 Pinecone 项目、索引和克隆的 repo 从头开始​​重试。
  • 本文转载至元经纪

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值