Fluid 开源项目指南-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00777/article/details/140977656

Fluid 开源项目指南

fluidFluid 是一个开源的用于管理数据存储和数据处理的框架，支持多种数据处理和存储解决方案。 * 数据存储和处理框架、支持多种数据处理和存储解决方案 * 有什么特点：易于使用、支持多种编程语言和平台、用于云原生应用程序的开发和管理项目地址:https://gitcode.com/gh_mirrors/fluid/fluid

1. 项目介绍

Fluid 是一个面向云原生的数据加速器，旨在实现 Kubernetes 上的全栈数据湖服务。该项目的主要目标是提供对大规模数据集的高效访问，支持在线分析处理以及实时计算，使得数据在 Kubernetes 集群中流动更加顺畅。它通过集成不同的数据处理框架，如 Alluxio 和 fuse-dfs，实现了对不同存储系统的统一管理，包括 HDFS、S3 等。

2. 项目快速启动

安装前提

确保已安装了 Kubernetes（>=1.18）集群，并配置好 kubectl 命令行工具。

安装 Fluid

添加 Fluid 的 Helm 仓库：

helm repo add fluid https://fluid.io/helm-repo

更新 Helm 仓库列表：
```
helm repo update
```

使用 Helm 安装 Fluid 运行时：

helm install fluid-fluid fluid/fluid --namespace=kube-system

创建一个 DataVolume CRD（假设名为 mydatavolume），指定数据源：

apiVersion: data.fluid.io/v1alpha1
kind: DataVolume
metadata:
  name: mydatavolume
spec:
  storageClass: your-storage-class
  dataSource:
    name: your-data-source
    apiGroup: ""

替换 your-storage-class 为你的存储类名，your-data-source 为数据源名称。