- 博客(2)
- 资源 (12)
- 收藏
- 关注
原创 Spark,Hadoop,Hive
不同的业务场景决定了不同的系统架构选型。Hadoop 用于分布式存储和 Map-Reduce 计算,Spark 用于分布式机器学习,Hive 则是分布式数据库。Hive 和 Spark 是大数据领域内为不同目的而构建的不同产品。二者都有不可替代的优势。Hive 是一个基于Hadoop 的分布式数据库,Spark 则是一个用于数据分析的框架。 学习 Spark ,从大方向说,算子大致可以分为以下两类: (1)Transformation 变换 / 转换算子:这种变换并不触发提交作业,这种算子是延迟执行的,
2020-09-08 10:31:43 348 1
原创 hive 开窗函数使用
开窗函数格式 over(partition by ** order by ** rows between **) sum() max() count() min() avg() window 子句: preceding:往前 following:往后 current row:当前行 unbounded:起点 unbounded preceding:从前面的起点 unboundwd following:到后面的终点 测试数据集: name,orde
2020-09-07 14:19:52 524
JDBC开发精讲
2018-08-14
java_异常精讲
2018-08-10
java接口精讲
2018-08-10
java抽象类
2018-08-10
javaSetMap接口
2018-08-10
java文件与I/O流
2018-08-09
java内部类
2018-08-09
java基础标示符数据类型运算符
2018-08-09
java基础流程控制循环结构
2018-08-09
java基础流程控制if,switch分支
2018-08-09
java基础继承
2018-08-09
apache-tomcat-7.0.90-windows-x86
2018-07-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人