自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Murphyt的专栏

数据挖掘机器学习

07月 05月 03月 02月 01月

原创 spark RDD详解

RDD(Resilient Distributed Dataset)是Spark的最基本抽象，是对分布式内存的抽象使用，实现了以操作本地集合的方式来操作分布式数据集的抽象实现。RDD是Spark最核心的东西，它表示已被分区，不可变的并能够被并行操作的数据集合，不同的数据集格式对应不同的RDD实现。RDD必须是可序列化的。RDD可以cache到内存中，每次对RDD数据集的操作之后的结果，都可以存放到

2016-02-27 11:17:09 1183

hadoop权威指南

本书从Hadoop的缘起开始，由浅入深，结合理论和实践，全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章，3个附录，涉及的主题包括：Hadoop简介；MapReduce简介；Hadoop分布式文件系统；Hadoop的I/O、MapReduce应用程序开发；MapReduce的工作机制；MapReduce的类型和格式；MapReduce的特性；如何安装Hadoop集群，如何管理Hadoop；Pig简介；Hbase简介；ZooKeeper简介，最后还提供了丰富的案例分析。

2015-03-19

经典算法大全

C语言是一种计算机程序设计语言，它既具有高级语言的特点，又具有汇编语言的特点

2014-06-23

c语言经典代码

c语言是很好地一门语言，这里有优秀的c语言代码，帮你快速提高c语言能力，走向成功之路，c经典代码，好好学习吧

2014-06-23

鸟哥的linux

linux的提高有帮助，好好学习linux吧

2014-03-09

嵌入式linux应用开发

嵌入式linux开发的技术手册，对有linux基础的人有很好提高

2014-03-09

离散数学第四版答案 kenneth

离散数学答案，很全很好，让大家做完后能看看答案来全额顶自己做的是否正确，希望大家能好好学习计算机相关课程

2014-01-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

大数据最好 CSDN认证博客专家 CSDN认证企业博客

码龄11年

IP 属地：新加坡

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

102: 原创

17万+: 周排名

73万+: 总排名

19万+: 访问

: 等级

2624: 积分

90: 粉丝

46: 获赞

13: 评论

229: 收藏

私信

关注

热门文章

分类专栏

最新评论

ETL介绍与ETL工具比较
shing1098: Talend提供了丰富的插件和组件，扩展性较强，运行速度快，Informatica功能强大、稳定性高，支持高可用性和容错性，etlcloud是Web的 ETL 可视化工具，提供很多数据集成和转换功能，支持多种数据源的连接和转换操作，这三款也是不错的，各有各的特色
spark RDD详解
醉与浮: 请问这是哪本书？
对数据的认识(二)
Echo274: 博主请问图咋都没了
ETL介绍与ETL工具比较
登峰大数据: 实时数仓的建设，确实需要一个得心应手的ETL工具，我们用的是Streamsets这个大数据流批一体的ETL工具，多多交流！
数据仓库面试题资料
m0_46665164: 谢谢

最新文章

提示

确定要删除当前文章？

取消删除