用Java、Scala编写Spark应用程序

 

一、官网下载安装Scala:scala-2.12.8.tgz

https://www.scala-lang.org/download/

tar -zxvf scala-2.12.8.tgz -C /opt/module

mv scala-2.12.8 scala

测试:scala -version

启动:scala

二、官网下载安装Spark:spark-2.4.2-bin-hadoop2.7.tgz

https://www.apache.org/dyn/closer.lua/spark/spark-2.4.2/spark-2.4.2-bin-hadoop2.7.tgz

解压、重命名

启动spark

  • 先启动hadoop 环境  start-all.sh

②启动spark环境

进入到SPARK_HOME/sbin下运行start-all.sh/opt/module/spark/sbin/start-all.sh

查看spark的web控制页面:http://bigdata128:8080/

③启动Spark Shell

此模式用于interactive programming,先进入bin文件夹后运行:spark-shell

SecureCRT 下 spark-shell 下scala>

④退出Spark Shell

scala> :quit

三、使用Spark Shell编写代码

读取本地文件(scala中运行)

Val textFile=sc.textFile(file:///opt/module/spark/bin/f1.txt)

显示第一行内容

textFilefirst()

读取HDFS文件

Val textFile=sc.textFile(“hdfs://192.168.43.87:9000/f1.txt”)

对上述hdfs根目录下f1.txt文件进行词频统计

查看结果

四、用Scala语言编写Spark独立应用程序

第一个Spark应用程序:WordCount

参照网址:

http://dblab.xmu.edu.cn/blog/1311-2/

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值