presto:
https://blog.csdn.net/u011596455/article/details/86558218
部署:
https://blog.csdn.net/weixin_33701564/article/details/91894251
EMR:
https://help.aliyun.com/document_detail/64035.html?spm=a2c4g.11186623.6.827.424b2ae70yGokQ
Presto 是一款由FaceBook开源的一个分布式SQL-on—Hadoop分析引擎。Presto目前由开源社区和FaceBook内部工程师共同维护,并衍生出多个商业版本
使用的技术,如向量计算,动态编译执行计划,优化的ORC和Parquet Reader等
presto不太支持存储过程,支持部分标准sql
presto的查询速度比hive快5-10倍
上面讲述了presto是什么,查询速度,现在来看看presto适合干什么
适合:PB级海量数据复杂分析,交互式SQL查询,支持跨数据源查询
不适合:多个大表的join操作,因为presto是基于内存的,多张大表在内存里可能放不下
presto是一个交互式查询引擎,可以在很短的时间内返回查询结果,秒级,分钟级,能访问很多数据源
Presto支持的数据源和存储格式:
Hadoop/Hive connector与存储格式:
HDFS,ORC,RCFILE,