lateral view
lateral view的语法:
lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (’,’ columnAlias)
fromClause: FROM baseTable (lateralView)
描述:
lateral view用于和split、explode等UDTF一起使用的,能将一行数据拆分成多行数据,在此基础上可以对拆分的数据进行聚合,lateral view首先为原始表的每行调用UDTF,UDTF会把一行拆分成一行或者多行,lateral view在把结果组合,产生一个支持别名表的虚拟表。
简而言之,在遇到行列转换需要使用UDTF(一行转换成多行)的函数的时候,需要配合着later view一起使用
explode()与posexplode()
原始数据的样子:
1、单列explode,将一行数据变成多行:
2、单列posexplode->打标签
lateral view始终坚持着一进多出的原则
3、多列explode
将两列的值进行explode,将学生的名字与成绩匹配到一起
按照传统的想法,直接对两列的数值进行explode,可以直接匹配结果,但实际上会出现笛卡尔积
修改之后:
感谢阅读,我是啊帅和和,一位大数据专业大四刚实习学生,祝你快乐。