tips:基于hadoop的Trino多源、即席查询引擎:多源数据即席查询Trino(Presto)引擎剖析 - 知乎 (zhihu.com)
map join: MAPJION会把小表全部加载到内存中,在map阶段直接拿另外一个表的数据和内存中表数据做匹配,由于在map端是进行了join操作,省去了reduce运行的时间,算是hive中的一种优化。
1.hadoop的特点
* 高可靠性、高扩展性(动态增加节点)
tips:基于hadoop的Trino多源、即席查询引擎:多源数据即席查询Trino(Presto)引擎剖析 - 知乎 (zhihu.com)
map join: MAPJION会把小表全部加载到内存中,在map阶段直接拿另外一个表的数据和内存中表数据做匹配,由于在map端是进行了join操作,省去了reduce运行的时间,算是hive中的一种优化。
* 高可靠性、高扩展性(动态增加节点)