自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大唐帝国—前营

专注大数据、人工智能、鸿蒙、产品管理和项目管理

  • 博客(2)
  • 资源 (2)
  • 收藏
  • 关注

原创 图解SparkContext创建过程

1.SparkContext构建的顶级三大核心对象:DAGScheduler、TaskScheduler、ShedulerBackend,其中: 1)DAGScheduler是面向Job的Stage的高层调度器; 2)TaskScheduler是一个接口,根据具体的Cluster Manager的不同会有不同的实现,Standalone模式下具体的实现是TaskSchedulerImpl;

2017-09-21 15:09:34 866

原创 Spark作业执行原理

Spark的作业和任务调度系统是Spark的核心,它能够有效地进行调度根本原因是对任务划分DAG和容错,使得它对低层到顶层的各个模块之间的调用和处理显得游刃有余。下面介绍一些相关术语。 作业(Job):RDD中由行动操作所生成的一个或多个调度阶段。调度阶段(Stage):每个Job作业会因为RDD之间的依赖关系拆分成多组任务集合,称为调度阶段,简称阶段,也叫做任务集(TaskSet)。调

2017-09-05 09:16:51 607

Hive数据仓库(一)

Hive是hadoop领域的数据仓库。它提供了一套工具可以让我们非常方便的管理位于HDFS中的大型数据集,它提供了一套类似于SQL的查询语言,可以很容易的查询hive中的数据。Hive也有数据库、表、视图、索引、函数等概念,非常类似于我们常用的关系型数据库,因此入手非常方便。本资源是Hive授课讲义的一部分。

2016-09-25

锋利的jQuery

一本关于jQuery很经典的书,不可错过哦!

2012-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除