静灵公子
码龄11年
关注
提问 私信
  • 博客:3,579
    3,579
    总访问量
  • 3
    原创
  • 2,152,576
    排名
  • 2
    粉丝
  • 0
    铁粉

个人简介:但行好事,莫问前程

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2013-11-16
博客简介:

u012860967的博客

查看详细资料
个人成就
  • 获得2次点赞
  • 内容获得0次评论
  • 获得35次收藏
创作历程
  • 3篇
    2019年
TA的专栏
  • SQL
  • Spark
    3篇
  • Spark内核之美
    3篇
兴趣领域 设置
  • 数据结构与算法
    推荐算法
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

345人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Kafka官方中文文档.pdf

发布资源 2019.11.15 ·
pdf

Spark内核之美(三):DAGScheduler的原理与源码分析

1、前言RDD具有延迟计算的特性,当操作是transformation算子的时候,并不执行操作,直到遇到action算子的时候才开始执行计算。Spark会根据Action操作之前一系列Transform操作的关联关系,生成一个DAG,在后续的操作中,对DAG进行Stage划分,生成Task并最终运行。表1Spark中支持的RDD转换(transformation算子)和动作(actio...
原创
发布博客 2019.04.07 ·
796 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Spark内核之美(二):RDD的五大主要特性与源码分析

摘要RDD,弹性分布式数据集,是spark的底层数据结构。RDD是一个容错的,可以被并行操作的数据集合。RDD的特点之一是分布式存储,它的好处就是数据存储在不同的节点上,当需要数据进行计算的时候可以在这些节点上并行操作。弹性表现在节点在存储RDD数据的时候,既可以存储在内存中,也可以存储在磁盘上,也可以两者结合使用。RDD还有个特点就是延迟计算,当是transformation算子的时候,并不...
原创
发布博客 2019.04.07 ·
1088 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Spark内核之美(一):RDD的原理与源码分析

Spark 是加州大学伯克利分校A岛。实验室( Algorithms 、Machines and People Lab )开发的通用大数据处理框架。Spark 生态系统也称为BDAS , 是伯克利APM 实验室所开发的,力图在算法( Algorithms )、机器( Machines )和人( People ) 三者之间通过大规模集成来展现大数据应用的一个开源平台。以下内容是对加州大学伯克利分校论...
原创
发布博客 2019.04.06 ·
1693 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

flink资料分享

发布资源 2018.11.06 ·
zip

Window与Time

发布资源 2018.11.06 ·
pdf

DataStreamAPI介绍与实战

发布资源 2018.11.06 ·
pdf

毕向东Java知识总结

发布资源 2017.11.16 ·
pdf

Python核心编程(第3版)PDF高清晰完整中文版(无水印)

发布资源 2017.11.01 ·
pdf

hadoop权威指南第三版(原版超清)

发布资源 2017.09.26 ·
pdf

十五个经典算法研究与总结、目录+索引

发布资源 2017.09.26 ·
pdf

微软面试 100 题

发布资源 2017.09.26 ·
pdf

FFT和IFFT的MATLAB实现代码

发布资源 2014.11.07 ·
zip

数字图像霍夫曼编码压缩编码MATLAB实现

发布资源 2014.04.12 ·
m