![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Sparks
文章平均质量分 53
吉克阿杰
热爱软件,对技术有独特的追求
展开
-
每天一点进步:Spark RDD三大特性
RDD是弹性分布式数据集(Resilience distributes Datasets )的简称,即一个被分区的数据集。RDD的来源只有两种:一种是从内存中的集合和外部存储系统,另外一种是通过转换操作来自其他RDD原创 2015-12-11 00:02:59 · 1649 阅读 · 0 评论 -
每天一点进步:Spark运行模式和原理
在实际引用中,spark应用程序运行模式取决于传递给sparkContext的master环境变量的值。目前所支持的master环境变量由特定的字符串或者URL组成,原创 2015-12-17 18:10:52 · 534 阅读 · 0 评论