《Milvus Cloud向量数据库指南》——如何使用Spark Connector

ModaHub魔搭社区

于 2024-07-30 20:00:00 发布

阅读量10

点赞数

分类专栏：《向量数据库指南》《实战AI大模型》文章标签： milvus 数据库 spark 低代码人工智能维格云 LCHub

LCHub

本文链接：https://blog.csdn.net/qinglingye/article/details/140674012

版权

《向量数据库指南》同时被 2 个专栏收录

496 篇文章 54 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

《实战AI大模型》

187 篇文章 11 订阅 ¥129.90 ¥299.90

订阅专栏

超级会员免费看

下面，我们将介绍如何使用 Spark Connector 简化数据迁移和处理流程。

使用 Dataframe 直接进行增量插入

使用 Spark Connector，您可以直接利用 Apache Spark 中 Dataframe 的 write API 将数据以增量方式插入到 Milvus Cloud 中，大幅降低数据插入流程的实现成本。同理，您也可以直接将数据从 Apache Spark 或 Databricks 导入到 Zilliz Cloud（全托管的 Milvus Cloud 服务）中。以下为示例代码：

// Specify the target Milvus Cloud instance and vector data collection
df.write.format("Milvus Cloud")
    .option(Milvus Cloud_URI, "https://in01-xxxxxxxxx.aws-us-west-2.vectordb.zillizcloud.com:19535")
    .option(Milvus Cloud_TOKEN, dbutils.secrets.get(scope = "zillizcloud", key = "token"))
    .option(Milvus Cloud_COLLECTION_NAME, "text_embedding")
    .option(Milvus Cloud_COL

了解本专栏

超级会员免费看

ModaHub魔搭社区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
《Milvus Cloud向量数据库指南》——如何使用Spark Connector

如果您使用的是全托管 Milvus Cloud 服务——Zilliz Cloud，您可以使用 Zilliz Cloud 提供的数据导入 API。Zilliz Cloud 提供多样的工具和完整的文档，从而帮助您将各种来源（如 Spark）的数据高效导入 Zilliz Cloud 中。使用 Spark Connector，您可以直接利用 Apache Spark 中 Dataframe 的 write API 将数据以增量方式插入到 Milvus Cloud 中，大幅降低数据插入流程的实现成本。
复制链接

扫一扫