![5a88ba541525993483f3bf2eaec50048.gif](https://i-blog.csdnimg.cn/blog_migrate/215cd29146a850bf337ade0e3e494b4c.gif)
大家好,今天由取经儿老师带来一篇硬核干货——Hive SQL中的神技巧。
作者简介:
取经儿
前小米、网易数据分析师
目前所有大厂数据分析师都在使用 Hive SQL 进行数据分析。今天给大家介绍下 Hive SQL 中两个重要技巧:行列互转和 row_number 函数。
这两个技巧在面试中也经常被问及,所以非常值得一学。
01行列互转行列互转,在数据处理中比较常见。简单来说,它指的就是把一行拆成多行,或者把多行按照某种条件聚合为一行。
这里,我会分别举例说明你在什么工作场景中会用到行列转换,以及如何操作。
1)行转列用法
假设一个字段是由一个数组构成,实际统计时可能需要把这个数组展开后再进行统计。
比如,为解决各类业务问题,算法会针对不同用户进行多种 A/B 实验策略,最后看不同策略中哪一个对解决业务问题有效。