开源 数据仓库_使用这些开源工具进行数据仓库

本文介绍了如何利用开源工具Apache Druid作为数据存储,Apache Superset作为查询界面,以及Apache Airflow作为任务协调器来构建数据仓库系统。Druid以其亚秒级OLAP查询、实时流处理和可扩展性脱颖而出,但不支持复杂的SQL操作。Apache Superset提供友好的查询界面,而Apache Airflow则用于工作流的协调和监控。
摘要由CSDN通过智能技术生成

开源 数据仓库

by Simon Späti

西蒙·斯派蒂(SimonSpäti)

使用这些开源工具进行数据仓库 (Use these open-source tools for Data Warehousing)

These days, everyone talks about open-source software. However, this is still not common in the Data Warehousing (DWH) field. Why is this?

如今,每个人都在谈论开源软件。 但是,这在数据仓库(DWH)字段中仍然不常见。 为什么是这样?

For this post, I chose some open-source technologies and used them together to build a full data architecture for a Data Warehouse system.

在这篇文章中,我选择了一些开源技术,并将它们一起用于构建数据仓库系统的完整数据体系结构。

I went with Apache Druid for data storage, Apache Superset for querying, and Apache Airflow as a task orchestrator.

我使用Apache Druid进行数据存储,使用Apache Superset进行查询,并使用Apache Airflow作为任务编排器。

德鲁伊—数据存储 (Druid — the data store)

Druid is an open-source, column-oriented, distributed data store written in Java. It’s designed to quickly ingest massive quantities of event data, and provide low-latency queries on top of the data.

Druid是一个用Java编写的开源,面向列的分布式数据存储。 它旨在快速提取大量事件数据,并在数据之上提供低延迟查询。

为什么要使用德鲁伊? (Why use Druid?)

Druid has many key features, including sub-second OLAP queries, real-time streaming ingestion, scalability, and cost effectiveness.

Druid具有许多关键功能,包括亚秒级OLAP查询,实时流接收,可伸缩性和成本效益。

With the comparison of modern OLAP Technologies in mind, I chose Druid over ClickHouse, Pinot and Apache Kylin. Recently, Microsoft announced they will add Druid to their Azure HDInsight 4.0.

考虑到现代OLAP技术比较 ,我选择了Druid而不是ClickHouse,Pinot和Apache Kylin。 最近, Microsoft宣布将把Druid添加到其Azure HDInsight 4.0中。

为什么不德鲁伊? (Why not Druid?)

Carter Shanklin wrote a detailed post about Druid’s limitations at Horthonwork.com. The main issue is with its support for SQL joins, and advanced SQL capabilities.

Carter Shanklin在Horthonwork.com上写一篇有关Druid局限性的详细文章 。 主要问题是它对SQL连接的支持以及高级SQL功能。

德鲁伊的体系结构 (The Architecture of Druid)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值