Presto介绍、原理、安装、使用

Apache Presto是一个开源的分布式SQL查询引擎,用于大数据环境的交互式数据分析,支持多种数据源。其架构包括Coordinator、Worker和Connector,通过标准的ANSI SQL语法提供跨数据源查询能力,具备高扩展性和低延迟响应。本文介绍了Presto的原理、安装部署以及命令行Client的使用。
摘要由CSDN通过智能技术生成

presto官网文档:https://prestodb.github.io/getting-started.html

一、Presto介绍

Apache Presto 是一个开源的分布式 SQL 查询引擎,它可以在大数据环境下进行交互式的数据分析。Presto 允许用户使用熟悉的 SQL 语法在不同的数据源上进行查询,比如 Hive、Cassandra、PostgreSQL、Kafka、MySQL、ElasticSearch 等,让用户可以在不同数据源上进行统一查询。

二、架构

Presto 的架构由 Coordinator、Worker 和 Connector 三部分组成。
Coordinator进程 :接收来自客户端的查询,解析查询语句,生成查询计划,并把计划分发给 Workers 执行,任务调度,Woker管理;

Workers 进程:实际执行被分解的查询计划任务,并返回结果给 Coordinator;
Connector :则允许 Presto 连接到各种不同的数据源,让用户可以在单个查询中结合来自多个数据源的数据。

执行流程如下图所示:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值