Spark API 详解/大白话解释之 RDD、partition、count、collect

最新推荐文章于 2023-05-21 19:33:15 发布

Tiger-Li

最新推荐文章于 2023-05-21 19:33:15 发布

阅读量308

点赞数

分类专栏： Latex

Latex 专栏收录该内容

78 篇文章 11 订阅

订阅专栏

Spark API 详解/大白话解释之 RDD、partition、count、collect

标签： spark

2016-01-21 11:25 6086人阅读评论(0) 收藏举报

分类：

Spark（34）

版权声明：本文为博主原创文章，未经博主允许不得转载。 http://blog.csdn.net/guotong1988/article/details/50554034

RDD定义：

任何数据在Spark中都被转换为RDD。

一个RDD可以看成是一个数组

不过是分到各个分区，分布在不同的机器上，可并行处理。

分区的定义：
一个RDD有多个RDD分区
一个RDD分区只在一个机器上
一个机器可有多个RDD分区
http://stackoverflow.com/questions/31359219/relationship-between-rdd-partitions-and-nodes

由数据转换为RDD：

举例：从普通数组创建RDD，里面包含了1到9这9个数字，它们分别在3个分区中。这个RDD一共9个元素，每个元素含有一个数字

val a = sc.parallelize(1 to 9, 3)

1

举例：读取本地文件README.md来创建RDD，文件中的每一行就是RDD中的一个元素，分区是2

val b = sc.textFile("README.md",2)

1

count( )
返回RDD的元素个数

collect( )
返回整个RDD

http://homepage.cs.latrobe.edu.au/zhe/ZhenHeSparkRDDAPIExamples.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark API 详解/大白话解释之 RDD、partition、count、collect

Spark API 详解/大白话解释之 RDD、partition、count、collect标签： spark2016-01-21 11:25 6086人阅读评论(0) 收藏举报分类：Spark（34）版权声明：本文为博主原创文章，未经博主允许不得转载。 http://blog.csdn.net/guotong1988/article/details/50554034RDD定义：任何...
复制链接

扫一扫

专栏目录

Tiger-Li CSDN认证博客专家 CSDN认证企业博客

码龄14年

75: 原创

2万+: 周排名

46万+: 总排名

435万+: 访问

: 等级

2万+: 积分

1153: 粉丝

1790: 获赞

214: 评论

7575: 收藏

私信

关注

热门文章

分类专栏

最新评论

直方图均衡化
starman584: 找的就是这个图片推导，别的不说，这个才是精华
定点数的表示方法
做而论道_CS: 补码提出来不就是为了方... －－－－－－－－－补码，就是用来唬你的。补码，实际上，就是正常的数字！计算机中，根本就没有补码。（更没有原码反码了）。你失去了正常的概念，已经走火入魔了。你是被人忽悠瘸了，手表，都看不懂了。
定点数的表示方法
cwxia0s: 根源是舍弃进位不假，然后呢，是为了解决什么问题，还不是加法当加法器用，补码提出来不就是为了方便的处理负数吗，不管取反加一也好，加一个周期也好，不管怎么看，总要实现出来，上升到思维的高度，小心走火入魔
定点数的表示方法
cwxia0s: 引用你自己博客写的： ``` 为什么要使用补码呢？补码，究竟是什么东西呢？其实，补码，就是一个【代替负数进行运算的正数】。有了补码，负数，就成了正数，减法运算，也就转成了加法运算。因此，加、减法，就都可以统一用加法运算。这么一来，计算机的硬件，就可以得到简化。 ``` 补码的意义再说，你看看你说的什么东西： ``` 舍弃进位，加法可以当减法，这是小朋友都能看懂的知识。计算机专家，为什么要编造符号位原码反码 ...，这些虚假的故事呢？因为，这些专家，小学都没有毕业！ ``` ``` 是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。 ``` 补码的意义是在实际中，简化电路设计，引入这种计算方式，这就是在电路设计背景下提出的，有错吗你的理解能力，素质，都堪忧，别回复我了，看你的言论就晦气
定点数的表示方法
做而论道_CS: 补码的计算是在电路设计的背景下引入的－－－－－－－－－你说的，不对啊！是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。是理论，指导实践。你这思维方式，还能搞个蛋的技术，真就不错了。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。