scala
文章平均质量分 78
yaoyaostep
这个作者很懒,什么都没留下…
展开
-
spark运行流程
计算模型 基本概念 l Application:应用。可以认为是多次批量计算组合起来的过程,在物理上可以表现为你写的程序包+部署配置。应用的概念类似于计算机中的程序,它只是一个蓝本,尚没有运行起来。 l RDD:Resilient Distributed Datasets,弹性分布式数据集。RDD即是计算模型里的一个概念,也是你编程时用到的一种类。一个RDD可以认为是spark在执行分布转载 2016-11-29 11:16:57 · 550 阅读 · 0 评论 -
spark 2.2 源码分析 Spark-submit 篇
spark 2.2 源码分析 Spark-submit 篇 本文主要分析spark的第一步spark-submit类。之前shell阶段主要就是环境变量的加载,而个人认为spark-submit才是spark程序的真正步。由上文可知org.apache.spark.launcher.Main 启动了 org.apache.spark.deploy.SparkSubmit。我们来看一下submi原创 2017-11-22 23:24:24 · 1066 阅读 · 0 评论 -
scala 通配符的用法
1. 用于替换Java的等价语法 由于大部分的Java关键字在Scala中拥有了新的含义,所以一些基本的语法在Scala中稍有变化。 1.1 导入通配符 *在Scala中是合法的方法名,所以导入包时要使用_代替。 //Java import java.util.*; //Scala import java.util._ 1.2 类成员默认值 Java中类成员可以不赋初始值,编译器会转载 2017-11-25 18:43:31 · 2972 阅读 · 0 评论