体验第一个spark程序

体验第一个spark程序

1、在spark目录执行


bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop01:7077 \
--executor-memory 1G \
--total-executor-cores 1 \
examples/jars/spark-examples_2.11-2.3.2.jar \
10

–master spark://hadoop01:7077 :指定Master的地址是hadoop01
–executor-memory 1G :指定executor的内存为1G
–total-executor-cores 1 :指定每个executor使用的CPU核心数为1
2、 启动spark-shell

bin/spark-shell

3、 运行Spark-Shell读取HDFS文件

建立words.txt文件

cd /export/servers/spark
vi words.txt

4、在hadoop01先建立文件夹 /spark/test,将words.txt上传至 /spark/test

hadoop fs -mkdir -p /spark/test
hadoop fs -put words.txt /spark/test

5、整合Spark和HDFS

cd conf
vi spark.env

6、添加:export HADOOP_CONF_DIR=/export/servers/hadoop-2.7.4/etc/hadoop
分发

scp spark-env.sh hadoop02:/export/servers/spark/conf
scp spark-env.sh hadoop03:/export/servers/spark/conf

7、重启hadoop服务

stop-all.sh
start-all.sh

8、重启spark服务,spark/sbin下

stop-all.sh
start-all.sh

9、启动spark-shell

bin/spark-shell --master local[2]

10、编写Scala代码实现单词次数统计

sc.textFile("/spark/test/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

11、退出Spark-shell

:quit
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值