spark任务提交
spark目前提供python shell和scala shell两种交互式命令行运行Python Shell ./bin/pyspark
运行Scala Shell./bin/spark-shell
比如用户使用spark-shell或是pyspark脚本启动Spark应用程序,伴随应用程序启动的同时Spark会在当前终端启动REPL(Read–Eval–Print Loop)来接收用户的代码输入,并将其编译成Spark作业提交到集群上去执行
批处理:一种是使用spark自带的spark-submit工具提交示例如下:./spark-submit –class com.learn.spark.SimpleApp –master yarn –deploy-mode client –driver-memory 2g –executor-memory 2g –executor-cores 3 ../spark-demo.jar另一种是以javaAPI的方式进行提交,spark提供了以sparkLauncher作为唯一入口的API来实现官网示例: http://spark.apache.org/docs/latest/api/java/index.html?org/apache/spark/launcher/package-summary.html官网的样例不好使,这个网页的demohttps://www.cnblogs.com/lyy-blog/p/8522616.htmlhttps://www.cnblogs.com/lyy-blog/p/8522616.html
造成的问题:两种处理交互方式虽然看起来完全不一样