2017年10月_gaoshui87

10月 09月

原创 spark join shuffle 数据文件的读取

spark join shuffle 数据文件的读取我们看下在shuffle过程中数据文件的读取过程中调用的类对象// 下面就是对这个shuffler中的分片数据进行读取并进行相关的aggregate操作了 val blockFetcherItr = new ShuffleBlockFetcherIterator( context, blockManager.shuffleClient,

2017-10-19 16:53:32 599

原创 spark join shuffle 数据读取的过程

spark join shuffle 数据读取的过程在spark中，当数据要shuffle时，这个拉取过程RDD是怎么和ShuffleMapTask 关联起来的。在CoGroupedRDD通过调用如下函数去读取指定分区的数据 SparkEnv.get.shuffleManager .getReader(shuffleDependency.shuffleHandle, split.in

2017-10-18 18:22:06 1529

spark RDD join的核心过程spark join的过程是查询过程中最核心的过程，怎么做到实现两个表的关联查询耗费资源最少。可看源码如下 join的实现在 PairRDDFunctions类当中。def join[W](other: RDD[(K, W)], partitioner: Partitioner): RDD[(K, (V, W))] = self.withScope { thi

2017-10-18 14:52:18 2464

原创 spark task 任务状态管理

spark task 任务状态管理spark task 的任务状态经常进行更新，当任务完成后，这个任务是怎么取得结果的呢，看下面的代码流程def statusUpdate(tid: Long, state: TaskState, serializedData: ByteBuffer) { var failedExecutor: Option[String] = None // 进行状态的更新了 s

2017-10-16 19:59:25 3735

原创 spark RDD action job的提交过程之 taskSchedule

spark RDD action job的提交过程之 taskSchedule 在TaskSchedulerImpl中，有接收task 任务的接口 override def submitTasks(taskSet: TaskSet) { // 提交dag task 任务了 val tasks = taskSet.tasks logInfo("Adding task set " + taskSet

2017-10-13 11:26:30 467

原创 spark RDD action job的提交过程

spark RDD action job的提交过程以RDD的 count()方法的例子为例，来演示 dag生成提交的过程。def count(): Long = sc.runJob(this, Utils.getIteratorSize _).sum 上面直接调用到 runJob的方法 def runJob[T, U: ClassTag]( rdd: RDD[T], func: (Tas

2017-10-12 20:05:45 473

原创 spark work ResultTask 源码分析

spark work task 源码分析rdd在各个 CoarseGrainedExecutorBackend 进程中，经典的业务执行过程private[spark] class ResultTask[T, U]( stageId: Int, stageAttemptId: Int, taskBinary: Broadcast[Array[Byte]], partition: Partition,

2017-10-10 10:53:45 325

Netty权威指南 pdf全书下载

Netty权威指南详细介绍了netty技术框架的实现原理。介绍了一个基于netty框架的通讯框架的实现过程，并对核心的类进行的分析。

2015-08-11

android 动态加载class

一个动态加载android 的class框架，过程是先解压一个完全的apk，然后创建自己的dexclassloader，然后动态加载指定的activity的过程

2015-05-24

淘宝TFS架构演进

淘宝TFS架构演进淘宝TFS架构演进淘宝TFS架构演进

2015-05-17

APK加壳demo

加壳技术所谓apk的加壳技术和pc exe的加壳原理一样，就是在程序的外面再包裹上另外一段代码，保护里面的代码不被非法修改或反编译，在程序运行的时候优先取得程序的控制权做一些我们自己想做的工作

2015-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

gaoshui87的专栏