[用Browserbase提升你的AI数据检索效率！快速入门指南]

最新推荐文章于 2025-05-06 13:55:58 发布

akhfuiigabv

最新推荐文章于 2025-05-06 13:55:58 发布

阅读量570

点赞数 4

文章标签： python

本文链接：https://blog.csdn.net/akhfuiigabv/article/details/142688329

版权

用Browserbase提升你的AI数据检索效率！快速入门指南

引言

在人工智能和数据科学领域，获取准确和高质量的数据是至关重要的。Browserbase为开发者提供了一种强大、可靠的方式来管理和监控无头浏览器，从复杂UI中提取数据。本文将介绍如何使用Browserbase进行数据加载，以及一些常见问题的解决方案。

主要内容

安装与设置

注册并获得API Key和项目ID
首先，前往Browserbase官网注册账户，并获取API密钥和项目ID。

设置环境变量
将API Key和项目ID设为环境变量：

export BROWSERBASE_API_KEY='your_api_key'
export BROWSERBASE_PROJECT_ID='your_project_id'

安装Browserbase SDK
使用pip进行安装：
```
% pip install browserbase
```

加载文档

借助BrowserbaseLoader，可以轻松地将网页加载到LangChain中。

from langchain_community.document_loaders import BrowserbaseLoader

loader = BrowserbaseLoader(
    urls=[
        "https://example.com",
    ],
    # 使用文本模式
    text_content=False,
)

docs = loader.load()
print(docs[0].page_content[:61])
# 输出网页内容的前61个字符

选项说明

urls: 必选。需要提取的URL列表。
text_content: 可选。是否仅检索文本内容，默认为False。
api_key/project_id: 可选。默认使用环境变量。
session_id: 可选。提供现有会话ID。
proxy: 可选。启用/禁用代理。

加载图像

对于需要多模式模型（如GPT-4V）的项目，可以加载网页截图：

from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()

screenshot = browser.screenshot("https://browserbase.com")

result = chat.invoke(
    [
        HumanMessage(
            content=[
                {"type": "text", "text": "What color is the logo?"},
                GPT4VImage(screenshot, GPT4VImageDetail.auto),
            ]
        )
    ]
)

print(result.content)