自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (7)
  • 收藏
  • 关注

原创 java.lang.StackOverflowError when calling count()

Just to add some more clarity in the discussion, there is a difference between caching to memory and checkpointing, when considered from the lineage point of view. When an RDD in checkpointe

2015-08-18 14:47:28 499

原创 在Spark中实现map-side join和reduce-side join

以下说的都是二表Join,多表join则可以通过转化为多个二表join来实现。1. Map-side Join    如果要join的表中一个是大表,一个是小表(小到可以加载到内存中),就可以采用该算法。该算法可以将join算子执行在Map端,无需经历shuffle和reduce等阶段,因此效率非常高。    类似于Hadoop MapReduce中采用DistributedCac

2015-08-06 12:58:41 483

druid 源码分析 逐层详解

druid源代码解读 构架设计 分布式构建 设计模式 依赖注入等

2019-03-06

design patten 课程

介绍设计模式开发的起源,为什么使用,在哪里使用,如何使用,使用的好处,衡量标准,准则等

2019-03-06

docker 介绍及详细使用

docker 基础介绍及详细使用,本地化配置编排,docker的基础使用等

2019-03-06

spark rdd 操作详解

spark rdd相关操作详解;包括全部的操作说明和举例;

2015-04-22

Hive函数及语法说明

Hive函数及语法说明;详细中文语法说明;兼容性说明

2013-09-26

excel画直方图

excel画直方图,正太分布图,内置样例

2013-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除