- 博客(1)
- 收藏
- 关注
原创 Spark中对RDD的基本操作
1、SPARK简介 (1)一种计算框架.spark其实只是一个计算引擎,而hadoop包含了存储和计算。也就是说,spark最多也就能替换掉hadoop的计算部分(mapreduce)。可从事包含流计算机器学习等功能,和hadoop相互兼容(可以从HDFS读取数据)。 重要特征: 在mapreduce会反复使用磁盘进行数据读取的迭代,spark则将所需要的数据先加载进内存。所以spark速度...
2017-01-11 09:10:23 610
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人