《Kyuubi 和 Arctic 实验平台教程》

最新推荐文章于 2024-08-07 09:59:17 发布

郎凌队Lois

最新推荐文章于 2024-08-07 09:59:17 发布

阅读量605

点赞数 14

本文链接：https://blog.csdn.net/gitblog_00745/article/details/140979243

版权

《Kyuubi 和 Arctic 实验平台教程》

kyuubi-arctic-playgroundPlaybook of Kyuubi and Arctic Demo项目地址:https://gitcode.com/gh_mirrors/ky/kyuubi-arctic-playground

1. 项目介绍

Kyuubi 是一个用于多租户 SQL-on-Hadoop 的服务，它提供了 Thrift JDBC/ODBC 接口。其目标是实现高效、安全、可扩展的 SQL 查询服务，支持包括 Apache Hive、HDFS 及多种数据湖存储（如 Apache Iceberg、Hudi 和 Delta Lake）在内的多种数据源。Kyuubi 设计为服务器端插件，可以无缝集成到现有的大数据架构中，提供统一的 SQL 入口。

Arctic 则是一个高性能、低延迟的数据湖存储系统，专为实时分析而设计。它利用了列式存储、压缩和数据分区等特性，以提升查询效率。

2. 项目快速启动

要运行 Kyuubi 和 Arctic 示例，首先确保已安装 Docker。接下来执行以下命令来拉取并启动容器：

docker-compose up -d

这将启动 Kubernetes 集群、MySQL 数据库以及 Kyuubi 服务器。Kyuubi 端口可能是 4041 或 4042（取决于启动的 Spark 应用程序数量）。Flink UI 可在 http://localhost:8081 访问。

为了测试连接性，可以使用 Beeline 客户端：

docker exec -it kyuubi beeline -u "jdbc:hive2://kyuubi:10000/default;principal=hive/_HOST@LOCAL" -n user -p password

3. 应用案例和最佳实践

示例：从 MySQL 导入数据到 Arctic

使用预生成的静态数据填充 MySQL：

docker exec -it mysql-datagen \
    java -jar lakehouse-benchmark.jar \
    -b tpcc chbenchmark \
    -c config/mysql/sample_chbenchmark_config.xml \
    --create=true --load=true

启动 CDC（变更数据捕获）服务：

docker exec -it mysql-arctic-cdc \
    java -cp lakehouse-benchmark-ingestion-1.0-SNAPSHOT.jar \
    com.netease.arctic.benchmark.ingestion.MainRunner \
    -confDir /opt/lakehouse_benchmark_ingestion/conf \
    -sinkType arctic -sinkDatabase arctic_db

从 MySQL 生成 TPCC 数据：

java -jar lakehouse-benchmark.jar \
    -b tpcc chbenchmark \
    -c config/mysql/sample_chbenchmark_config.xml \
    --execute=true -s 5

4. 典型生态项目

Kyuubi 支持与多个生态系统组件集成，例如：

Apache Spark: 作为 SQL 引擎，Kyuubi 可以与 Spark SQL 结合，提供高效的批处理和流处理能力。
Apache Flink: 能够通过 SQL 进行实时分析。
Trino: 提供分布式 SQL 查询引擎，支持跨多个数据源的复杂查询。
BI 工具: 如 Tableau、Power BI 等可通过 ODBC/JDBC 与 Kyuubi 直接交互，实现实时数据分析和报表制作。

更多关于 Kyuubi 和 Arctic 的配置及高级用法，可以查阅它们各自的官方文档或 GitHub 仓库中的示例。

此教程提供了初步了解和使用 Kyuubi 和 Arctic 的步骤。实际环境中，可能需要根据具体需求进行更详细的配置和优化。祝你在大数据查询和分析之旅上一切顺利！

kyuubi-arctic-playgroundPlaybook of Kyuubi and Arctic Demo项目地址:https://gitcode.com/gh_mirrors/ky/kyuubi-arctic-playground

郎凌队Lois

关注

14
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
《Kyuubi 和 Arctic 实验平台教程》

《Kyuubi 和 Arctic 实验平台教程》 kyuubi-arctic-playgroundPlaybook of Kyuubi and Arctic Demo项目地址:https://gitcode.com/gh_mirrors/ky/kyuubi-arctic-playground 1. 项目介绍Kyuubi 是一个用于多租户 SQL-on-Hadoop 的服务，它提供了 Thrif...
复制链接

扫一扫