presto 基本架构服务

什么是 Presto

Presto 是一种工具,旨在使用分布式查询有效地查询大量数据。如果您使用 TB 或 PB 的数据,您可能会使用与 Hadoop 和 HDFS 交互的工具。Presto 被设计为替代使用 MapReduce 作业管道(如 Hive 或 Pig)查询 HDFS 的工具,但 Presto 不限于访问 HDFS。Presto 可以并且已经被扩展为在不同类型的数据源上运行,包括传统的关系数据库和其他数据源,如 Cassandra。

Presto 旨在处理数据仓库和分析:数据分析、聚合大量数据和生成报告。这些工作负载通常被归类为在线分析处理 (OLAP)。

Presto 服务器有两种类型:协调器和工作器。以下部分解释了两者之间的区别。

Coordinator
Presto 协调器是负责解析语句、规划查询和管理 Presto 工作节点的服务器。它是 Presto 安装的“大脑”,也是客户端连接以提交执行语句的节点。每个 Presto 安装都必须有一名 Presto 协调员以及一名或多名 Presto 工作人员。出于开发或测试目的,可以配置单个 Presto 实例来执行这两个角色。

协调器跟踪每个工作人员的活动并协调查询的执行。协调器创建涉及一系列阶段的查询的逻辑模型,然后将其转换为在 Presto 工作人员集群上运行的一系列连接任务。

协调器使用 REST API 与工作人员和客户端进行通信。

Worker
Presto worker 是 Presto 安装中的服务器,负责执行任务和处理数据。工作节点从连接器获取数据并相互交换中间数据。协调器负责从工作人员那里获取结果并将最终结果返回给客户端。

当 Presto 工作进程启动时,它会将自己通告给协调器中的发现服务器,这使得 Presto 协调器可以使用它来执行任务。

工作人员使用 REST API 与其他工作人员和 Presto 协调员进行通信。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值