一、Spark SQL 与 Presto 之间的差异
Presto 简单来说就是“SQL 查询引擎”,最初是为Apache Hadoop开发的。它是一个开源分布式 SQL 查询引擎,旨在针对各种规模的数据集运行交互式分析查询。
Spark SQL 是一种分布式内存计算引擎,在结构化和半结构化数据集之上有一个 SQL 层。由于它在内存中处理,因此在 Spark SQL 中处理速度会很快。
二、 Spark SQL 和 Presto 对比
三、SparkSQL/PrestoSQL 语法差异
id Spark SQL Presto SQL 差异
1 date_add(start_date, num_days) date_add(unit, value, timestamp)
unit = second,minute,hour,day,week,month,quarter,year 1)函数入参不一样
2 datediff(endDate, startDate)
SELECT datediff('2009-07-31', '2009-07-30'); date_diff(unit, timestamp1, timestamp2)
unit = second,minute,hour,day,week,month,quarter,year
Returns timestamp2 - timestamp1 exp