![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
文章平均质量分 50
小东升职记
人生陆远只有忘的甘静才会有江莱。
展开
-
Spark,Hadoop,Hive
不同的业务场景决定了不同的系统架构选型。Hadoop 用于分布式存储和 Map-Reduce 计算,Spark 用于分布式机器学习,Hive 则是分布式数据库。Hive 和 Spark 是大数据领域内为不同目的而构建的不同产品。二者都有不可替代的优势。Hive 是一个基于Hadoop 的分布式数据库,Spark 则是一个用于数据分析的框架。学习 Spark ,从大方向说,算子大致可以分为以下两类:(1)Transformation 变换 / 转换算子:这种变换并不触发提交作业,这种算子是延迟执行的,原创 2020-09-08 10:31:43 · 295 阅读 · 1 评论 -
hive 开窗函数使用
开窗函数格式over(partition by ** order by ** rows between **)sum() max() count() min() avg()window 子句: preceding:往前 following:往后 current row:当前行 unbounded:起点 unbounded preceding:从前面的起点 unboundwd following:到后面的终点测试数据集:name,orde原创 2020-09-07 14:19:52 · 495 阅读 · 0 评论