探索Browserbase：强大的无头浏览器管理平台

最新推荐文章于 2025-03-16 09:36:35 发布

dfvcbipanjr

最新推荐文章于 2025-03-16 09:36:35 发布

阅读量633

点赞数 4

文章标签： php 开发语言 python

本文链接：https://blog.csdn.net/dfvcbipanjr/article/details/143673454

版权

引言

在数据驱动的时代，自动从复杂的网页界面提取数据对许多AI应用来说至关重要。Browserbase作为一个可靠的开发者平台，提供了无头浏览器的运行、管理和监控功能，助力于AI数据的获取。本文将介绍Browserbase的核心功能、安装设置以及如何在LangChain中使用BrowserbaseLoader加载文档和图像。

主要内容

Browserbase的核心功能

无服务器基础架构：通过提供可靠的浏览器，能够从复杂的用户界面中提取数据。
隐身模式：内置指纹伪装技术和自动验证码解决方案，提高数据抓取的成功率。
会话调试器：通过网络时间线和日志查看浏览器会话，以便更好地监控和调试。
实时调试：快速调试自动化流程，提高开发效率。

安装与设置

从Browserbase获取API密钥和项目ID，并在环境变量中设置：
- BROWSERBASE_API_KEY
- BROWSERBASE_PROJECT_ID
安装Browserbase SDK：
```
% pip install browserbase
```

代码示例

使用LangChain加载文档

使用BrowserbaseLoader可以将网页加载到LangChain中，并选择将页面转换为纯文本。

from langchain_community.document_loaders import BrowserbaseLoader

loader = BrowserbaseLoader(
    urls=[
        "https://example.com",
    ],
    # 设置为文本模式
    text_content=False,
    # 使用API代理服务提高访问稳定性
)

docs = loader.load()
print(docs[0].page_content[:61])

加载图像

还可以将网页的截图加载为字节，供多模态模型使用，例如GPT-4V。

from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()

screenshot = browser.screenshot("https://browserbase.com")

result = chat.invoke(
    [
        HumanMessage(
            content=[
                {"type": "text", "text": "What color is the logo?"},
                GPT4VImage(screenshot, GPT4VImageDetail.auto),
            ]
        )
    ]
)

print(result.content)