文章目录:
一、概念:
1.1 Presto概念
1.2 Presto应用场景
1.3 Presto的架构组成部分:
1.4 Presto 优点:
Presto 缺点:
二、Presto优化
2.1数据存储
2.2 查询SQL优化
2.3 无缝替换Hive表
2.4 建表格式的选择
【水平有限,如有错误欢迎指正 .】
一、概念:
Presto 是一个开源的分布式SQL查询引擎,数据量支持GB到PB字节,主要用来处理秒级查询的场景。
1.1 Presto概念
Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。
Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。
注意:虽然Presto可以解析SQL,但它不是一个标准的数据库。不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP)。
1.2 Presto应用场景
Presto支持在线数据查询,包括Hive,关系数据库(MySQL、Oracle)以及专有数据存储。
一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。
Presto主要用来处理响应时间小于1秒到几分钟的场景。
1.3 Presto的架构组成部分:

最低0.47元/天 解锁文章
273

被折叠的 条评论
为什么被折叠?



