- 博客(2)
- 收藏
- 关注
转载 spark学习笔记-java调用spark简单demo
开发环境: win10+idea+jdk1.8+scala2.12.4 具体步骤: 编写scala测试类 object MyTest { def main(args: Array[String]): Unit = { val conf = new SparkConf() conf.setAppName("MyTest") ...
2018-04-10 00:12:00 262
转载 spark学习笔记-RDD
RDD是啥?(摘自词条) RDD(Resilient Distributed Datasets),弹性分布式数据集, 是分布式内存的一个抽象概念,RDD提供了一种高度受限的共享内存模型,即RDD是只读的记录分区的集合,只能通过在其他RDD执行确定的转换操作(如map、join和group by)而创建,然而这些限制使得实现容错的开销很低。对开发者而言,RDD可以看作是S...
2018-04-01 23:39:00 94
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人