Spark WEBUI
【Jobs,Stages,StorageLevel,Environment,Executors,SQL,Streaming 】
4040端口可以看到当前application中的所有的job,点击job可以看到当前job下对应的stage,点击stage出现stage下的task。
上传文件:
hdfs dfs -put /root/test/words /spark/data/
进入到Scala编程:去bin目录下:
./spark-shell --master spark://node01:7077
8080:sparkmaster
7077:sparkmaster提交的端口
8081:sparkworker的webUI端口
4040:web的端口
执行(必须要在active状态下启动):
sc.textFile("hdfs://node01:8080/spark/data/words").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect()