linux下安装spark

准备工作

1.将需要的jdk和spark安装包下载,这里都放在了/root/tools目录下

  

jdk的安装和设置

1. 解压缩安装包 tar -xvf jdk-8u151-linux-x64.tar.gz

2. 进入解压缩后的jdk文件中,使用pwd查看当前工作路径,然后修改文件vi ~/.bash_profile 

 3. ~/.bash_profile 文件的末尾加上jdk的环境变量,内容如下: 

4.让刚修改的文件生效,并使用java -version查看是否配置成功

       

spark的安装与配置

1. 解压spark安装包,tar -xvf spark-2.4.3-bin-hadoop2.7.tgz

2. 进入解压之后的文件中,进入conf目录,查看配置文件

3.修改配置文件spark-env.sh,注意,这个文件默认不存在,这里有spark-env.sh.template,复制一份并命名新文件为spaek-env.sh

4.查看之前的JAVA_HOME路径,在下一步中使用

5.修改文件spark-env.sh,在文件末尾添加如下内容:

6.回到spark的主目录中,找到sbin目录,然后启动spark,使用命令sbin/start-all.sh

7.使用jps查看是否启动成功

8.在spark根目录下的examples下jars目录下有一个jar文件,里面存放很多的例子

9.这里使用jar包,进行一个小测试,求圆周率

10.回到spark主目录,运行如下命令,这里的最后面的100是自己设置的值,可选择其他更大的值进行测试,可能会更精确

结果显示如下:

11.创建两个目录input,output,用来作为文件的输入输出目录

12.输入目录中,创建data.txt文件,内容如下

13.启动spark-shell交互式工具,黄框标记的日志,表示使用变量sc就可以操作Spark context

14.使用spark中的scala语言统计每个单词出现的次数

sc.textFile是读取文件,split(" ")空格分隔字符  map((_,1))单词计数,这里是一个元祖

reduceByKey将相同的进行累加

 

 

 

 

  • 2
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
安装 Apache SparkLinux 上通常涉及几个步骤,包括下载、解压、配置环境变量和添加到系统路径,以及可能的依赖项安装。这里是一个简化的概述: 1. **下载Spark**: 访问Apache Spark官网(https://spark.apache.org/downloads.html)下载适合你系统的版本。推荐选择最新的稳定版。 2. **下载Hadoop(可选)**:Spark通常需要Hadoop作为分布式文件系统,如果你没有现成的Hadoop集群,可以同时下载Hadoop并进行安装。 3. **解压安装包**:将下载的tar.gz或zip文件解压到你希望放置Spark目录的地方,例如 `/opt/spark`。 4. **配置环境变量**: - 在`.bashrc`或`.bash_profile`等配置文件添加Spark的bin目录到PATH,如 `export PATH=$PATH:/opt/spark/bin` - 可能还需要设置`SPARK_HOME`环境变量指向Spark安装目录。 5. **启动服务**: - 如果你打算运行Spark Standalone模式,可以在`conf/spark-env.sh`或`conf/spark-defaults.conf`配置master和worker节点信息。 - 启动Spark Master:`./sbin/start-master.sh` - 启动Worker:`./sbin/start-slave.sh --master spark://<master-ip>:7077` 6. **验证安装**: - 使用`jps`命令检查是否有`SparkMaster`和`SparkWorker`进程运行。 - 打开WebUI查看Spark的状态,通常在`http://<master-ip>:8080`。 7. **安装Scala(可选)**: Spark使用Scala编写,如果你的系统没有Scala,可以访问Scala官网(https://www.scala-lang.org/download/)下载并安装
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值