- 博客(4)
- 收藏
- 关注
原创 Hive窗口函数案例详解
语法:分析函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置)常用分析函数:聚合类avg()、sum()、max()、min()排名类row_number() 按照值排序时产生一个自增编号,不会重复rank() 按照值排序时产生一个自增编号,值相等时会重复,会产生空位dense_rank() 按照值排序时产生一...
2019-09-29 17:44:41
843
原创 Hive窗口函数最全案例详解
语法:分析函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置)常用分析函数:聚合类avg()、sum()、max()、min()排名类row_number() 按照值排序时产生一个自增编号,不会重复rank() 按照值排序时产生一个自增编号,值相等时会重复,会产生空位dense_rank() 按照值...
2019-09-29 16:43:19
380
原创 Hive架构与工作原理
组成及作用:用户接口:ClientCLI(hive shell)、JDBC/ODBC(java访问hive)、WEBUI(浏览器访问hive)元数据:Metastore元数据包括:表名、表所属的数据库(默认是default)、表的拥有者、列/分区字段、表的类型(是否是外部表)、表的数据所在目录等;默认存储在自带的derby数据库中,推荐使用MySQL存储MetastoreHa...
2019-09-29 11:20:20
833
原创 Hive之行转列与列转行
行转列原始数据:需求: 把星座和血型一样的人归类到一起。结果如下: 射手座,A 大海|凤姐 白羊座,A 孙悟空|猪八戒 白羊座,B 宋宋实现: vi person_info.txt 孙悟空 白羊座 A 大海 射手座 A 宋宋 ...
2019-09-27 18:56:57
367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人