一.Spark SQL模板解析
Spark Sql 关键字执行顺序跟Sql执行顺序类似:
1.先将from前两表做笛卡尔积加载进来形成虚拟表vt1,
2.on条件后为真的插入虚拟表形成vt2,
如果包含多个表,重复操作,
完成所有数据加载后, 开始对形成的大虚拟表vt2进行处理,
3.where 后为真的插入vt3
4.group by 进行行分组形成vt4
5.cube|roll up:超组形成vt5
6. HIving: 为true的插入vt6
7.select :形成vt7
8.distinct:形成vt8
10.order by形成vt9
11.top:形成vt10