Spark完全分布式集群搭建

本文档详细介绍了如何在4台CentOS-6.6虚拟机上搭建Spark完全分布式集群,包括环境准备、Scala安装、集群规划、配置文件修改以及启动步骤。重点讲解了为避免与Hadoop文件冲突而对start-all.sh和stop-all.sh文件的重命名,并强调了在启动Spark集群前需先启动Hadoop集群。
摘要由CSDN通过智能技术生成

环境准备

  • 服务器集群
    我用的CentOS-6.6版本的4个虚拟机,主机名为hadoop01、hadoop02、hadoop03、hadoop04,另外我会使用hadoop用户搭建集群(生产环境中root用户不是可以任意使用的)

  • spark安装包
    下载地址:https://mirrors.aliyun.com/apache/spark/
    我用的spark-2.2.0-bin-hadoop2.7.tgz
    要根据自己机器中的hadoop版本选择对应的spark版本、

1. 集群规划

1、安装Scala

下载路径:http://www.scala-lang.org/download/

拷贝文件到对应主机

(1)cp or SSH Secure File Transfer Client

(2)解压缩 tar -zvxf scala-2.12.2.tgz

(3)mv *** /opt/scala

(4)配

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值