虚拟机上安装spark+scala教程

最新推荐文章于 2024-05-01 21:42:19 发布

波点兔

最新推荐文章于 2024-05-01 21:42:19 发布

阅读量1k

点赞数 4

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_42437577/article/details/102524752

版权

10 篇文章 1 订阅

订阅专栏

先配置jdk，scala，spark，并启动scala和spark
1、配置spark-env.sh

cd conf

cp spark-env.sh.template spark-env.sh
vim spark-env.sh

在这里插入图片描述
在文件最后一行添加：

export LD_LIBRARY_PATH=$JAVA_LIBRARY_PATH

在这里插入图片描述
2、修改log4j.properties文件

cp log4j.properties.template log4j.properties

在这里插入图片描述

3、配置

export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native/:$LD_LIBRARY_PATH

在这里插入图片描述

4、启动spark

spark-shell

在这里插入图片描述
5、统计词频

val textFile=sc.textFile("file:/home/data/words")
textFile.flatMap(line =>line.split(" ")).map(word =>(word,1)).foreach(println)

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注