![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据调度平台
Spark on yarn
这个作者很懒,什么都没留下…
展开
-
大数据调度平台之-Azkaban
一、Spark-Core(三)回顾1.1、Spark on yarn的运行方式二、Shuffle的剖析2.1、2.1、IDEA下使用repartition和coalesce对用户进行分组2.2、coalesce和repartition在生产上的使用2.3、reduceByKey和groupByKey的区别2.4、图解reduceByKey和groupByKey2.5、reduceByKey和groupByKey的源码&&aggregateByKey2.6、collect原创 2020-06-13 17:45:34 · 2139 阅读 · 0 评论 -
大数据调度平台之Rundeck生产实践
一、项目回顾二、数仓的各项理论知识2.1、什么是数据仓库2.2、数仓分层-星型模型2.3、数仓分层-雪花模型2.4、数仓分层-星座模型三、ERP项目架构3.1、数仓分层流程图一、项目回顾...原创 2020-04-14 11:11:44 · 1149 阅读 · 0 评论