基础架构
Presto 基础概念
https://trino.io/docs/current/overview/concepts.html
数据源
Connector
连接到不同的数据库的组件,通过SPI机制实现。
Catalog
Catalog 包含schemas和数据引用相关信息,相当于给connector提供数据库元信息
Schema
一关系型数据库中的Schema一个意思
Query Execution Model
Statement
SQL语句
Query
一次查询
Stage
不同的查询阶段,类似于spark stage
Task
具体的任务,每个task有输入输出,一个task并发的在多个diver上执行
Split
数据集
Driver
Tasks包含一个或者多个并行driver. driver是系列算子的实例,可以想象成内存中的物理算子,
每个driver有输入和输出。
Operator
算子,消费,转换,生产数据。
Exchange
在不同的presto节点间传输不同stage的数据。不同的task通过 exchange client交换数据