自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

隔壁老杨的专栏

关注大数据,hadoop,hbase,spark,姑娘等相关话题

原创 Kafka-Partition副本同步流程与源码分析

Kafka-Partition副本同步流程与源码分析

2022-12-28 18:25:10 897 1

原创 Kafka-Topic创建源码分析

Kafka-Topic创建源码分析 kafka-topic的创建流程.

2022-12-26 20:07:20 817

原创 Kafka消息写入流程

Kafka源码分析 Producer写入消息流程与源码分析

2022-12-25 16:54:27 2087

原创 Java中的ForkJoin实现

Java中的ForkJoin实现 ForkJoinPool ForkJoinTask 源码

2022-12-14 13:23:18 545 1

原创 ConcurrentHashMap 线程安全的HashMap

ConcurrentHashMap 线程安全的HashMap

2022-12-14 13:15:07 580

原创 ConcurrentLinkedQueue(并发队列)

ConcurrentLinkedQueue(并发队列)

2022-12-14 13:12:01 1922

原创 ThreadPoolExecutor 线程池

ThreadPoolExecutor 线程池

2022-12-14 13:09:57 414

原创 CountDownLatch源码分析

CountDownLatch源码分析

2022-12-14 13:08:07 242

原创 Condition源码解析

java Condition源码解析

2022-12-14 13:04:41 382

原创 ReentrantReadWriteLock(读写锁)

ReentrantReadWriteLock java读写锁

2022-12-14 13:00:09 375

原创 ReentrantLock(重入锁)

ReentrantLock java重入锁

2022-12-14 12:56:08 261

原创 AQS(AbstractQueuedSynchronizer)

AQS AbstractQueuedSynchronizer

2022-12-14 12:53:17 318

原创 yarn中的cgroup调度

yarn中cgroup的调度

2016-09-22 12:00:38 4490

原创 kafka源码分析之consumer的源码

kafka源码分析之kafka-consumer接收log消息的源码

2016-07-27 10:44:33 9924 5

原创 kafka源码分析之producer

kafka源码分析之kafka producer发送数据源码分析

2016-07-27 10:39:52 17715

原创 kafka源码分析之kafkaserver的健康状态管理

kafka server的健康状态管理源码分析

2016-07-27 10:37:23 3944

原创 kafka源码分析之kafka的consumer的负载均衡管理

kafka中相同的group下多个consumer的负载均衡处理源码分析

2016-07-27 10:35:38 17213

原创 kafka源码分析之kafkacluster的管理-KafkaController

kafka-cluster源码 kafka-leader选举源码 kafka 源码

2016-07-27 10:31:24 4466

原创 kafka源码分析之副本管理-ReplicaManager

kafka源码分析 kafka日志的副本管理 kafka副本同步

2016-07-27 10:25:52 4588

原创 kafka源码之日志管理-LogManager

kafka源码分析 kafka的LogManager源码

2016-07-27 10:20:59 6024

原创 kafka源码分析之kafkaApis

kafka源码分析 kafkaApis的处理源码

2016-07-27 10:18:01 2626

原创 kafka源码分析之kafka启动-SocketServer

kafka socketserver的处理流程源码, kafka源码

2016-07-27 10:14:39 6335 2

原创 kafka源码之kafkaserver的启动

kafka 0.9.0源码 kafka源码分析 kafka server启动分析

2016-07-27 10:11:36 7248

原创 spark中的广播变量broadcast

本文是对spark中的广播变量broadcast的源码流程进行说明.

2016-02-19 08:54:50 37990 1

原创 spark的内存分配管理

这篇文章主要说明spark的两种内存分配管理的源代码,分析了1.6默认的统一内存管理与老版本中的静态内存管理的实现

2016-02-18 14:38:13 11277

原创 spark中的动态executor分配

spark源代码分析,spark中动态executor的配置项,spark动态executor的分配源代码分析

2016-02-03 18:34:44 19940 2

原创 spark的task调度器(FAIR公平调度算法)

spark源码分析,spark的任务调度之fair公平调度算法代码实现分析.

2016-02-01 16:19:49 4086 1

原创 spark的task调度器(FIFO先进先出调度算法)

spark源码分析,spark的FIFO(先进先出调度器)的实现代码分析.

2016-02-01 16:17:00 2507

原创 spark的task调度器(一)

spark源码分析,spark任务执行时对task的调度算法分析.

2016-02-01 16:13:47 2130

原创 spark源码action系列-saveAsHadoopDataset

spark源码分析,spark中分析结果存储hadoop的基础实现函数,spark saveAsTextFile底层实现, spark saveAsHadoopFile底层实现.

2016-01-29 15:33:03 3194

原创 spark源码action系列-reduce

spark源码分析,spark reduce action的实现流程,spark reduce与hadoop的mapreduce中reduce的区别.

2016-01-29 15:29:07 1816

原创 spark源码action系列-foreach与foreachPartition

spark源码分析,spark action中的foreach与foreachPartition的区别,spark foreach的代码实现流程,spark foreachPartition的代码实现流程.

2016-01-29 15:18:27 17451

原创 spark源码action系列-take

spark源码中关于top n的实现,spark action 中的take的实现代码.

2016-01-29 14:17:19 802

原创 spark源码action系列-count

spark源码, spark action count函数功能分析.

2016-01-29 13:48:58 1209

原创 spark源码action系列-collect

spark源码 RDD collect的函数说明

2016-01-29 13:40:01 1304

原创 spark源码action系列-开头部分

这里主要说明下spark中,具体执行任务时,执行的函数入口与spark driver如何得到每个task的返回结果.

2016-01-29 13:10:31 1024

spark transform系列__mapPartitions

mapPartitions/mapPartitionsWithIndex这两个transform中:mapPartitions与map的区别是map中是对每个partition中的iterator执行map操作,对 map过程中的每一条record进行传入的function的处理,而mapPartitions是把partition中整个iterator传给 function进行处理.如果是...

2016-01-29 09:24:40 286

spark transform系列__sample

Sample是对rdd中的数据集进行采样,并生成一个新的RDD,这个新的RDD只有原来RDD的部分数据,这个保留的数据集大小由fraction来进行控制,这个分析中,不分析sample的两个算法的具体实现,如果后期有必要时,可以分析这两个算法的具体的实现.首先,先看看sample的实现代码:def sample( withReplacement: Boolean, fract...

2016-01-29 09:22:41 206

spark transform系列__reduceByKey

reduceByKey 通过PairRDDFunctions进行的实现,reduceByKey的操作是把两个V类型的值进行处理,并最终返回的还是一个V类型的结果(V类型就是value的类型).针对一个reduceByKey的操作,需要执行shuffle的操作,也就是说如果包含有reduceByKey时,会生成两个执行的stage,第一个stage会根据shuffle的partition与分...

2016-01-29 09:21:31 134

spark transform系列__sortByKey

该函数主要功能:通过指定的排序规则与进行排序操作的分区个数,对当前的RDD中的数据集按KEY进行排序,并生成一个SHUFFLEdrdd的实例,这个过程会执行shuffle操作,在执行排序操作前,sortBy操作会执行一次到两次的数据取样的操作,取出RDD中每个PARTITION的部分数据, 并根据进行分区的partition的个数,按key的compare大小把某个范围内的key放到一个指...

2016-01-29 09:19:09 334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除