docker+centos7启动spark2.4.5+hadoop2.10.0集群 for macOS

本文详细介绍了如何在Docker环境下,使用CentOS7制作包含Spark2.4.5和Hadoop2.10的镜像,并搭建集群。内容包括配置SSH、安装JDK、Scala、Hadoop和Spark,以及启动和检查集群状态的方法。同时,文中列举了在搭建过程中可能遇到的问题及解决方案。
摘要由CSDN通过智能技术生成

一、制作镜像

1. centos 容器

# 下载centos镜像 
docker pull centos
# 创建一个容器
 docker run --name centos -itd centos /bin/bash
# 进入已启动的容器
docker attach centos

2.下载安装包

# 安装wget、ssh等基础服务
yum install -y net-tools which openssh-clients openssh-server iproute.x86_64 wget passwd
# 下载jdk1.8:https://www.oracle.com/cn/java/technologies/javase-jdk8-downloads.html
wget https://download.oracle.com/otn/java/jdk/8u231-b11/5b13a193868b4bf28bcb45c792fce896/jdk-8u231-linux-x64.tar.gz?AuthParam=1586404625_30c185b984c1c247e5e9c10cb056d0a5
# 下载hadoop2.10:https://hadoop.apache.org/old/releases.html
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.0/hadoop-2.10.0.tar.gz
# 下载spark2.4:https:https://spark.apache.org/downloads.html
wget https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.5/spark-2.4.5-bin-without-hadoop.tgz
# 下载scala2.12
wget https://downloads.lightbend.com/scala/2.12.3/scala-2.12.3.tgz

3.配置ssh

#修改root密码
passwd

修改配置文件

# 修改ssh配置文件
sed -i 's/UsePAM yes/UsePAM no/g' /etc/ssh/sshd_config
# 重启ssh服务
systemctl start sshd.service
#这里会报错
System has not been booted with systemd as init system (PID 1). Can't operate.
Failed to connect to bus: Host is down
#直接进行下面的命令就行,使用最后一步的命令启动就解决这个问题了

#退出容器
exit
# 将刚刚修改的容器保存为新的镜像
docker commit 6a5967a064bc my-ssh-centos
#启动容器(--privileged=true 和后面的 /sbin/init 必须要有,以特权模式启动容器,否则无法使用systemctl启动服务)
docker run -tid --privileged  --name my-ssh-centos my-ssh-centos /usr/sbin/init
#进入容器
 docker exec -it my-ssh-centos /bin/bash 

设置ssh免密登录

cd ~;ssh-keygen -t rsa -P '' -f ~/.ssh/id_dsa;cd .ssh;cat id_dsa.pub >> authorized_keys

4.安装jdk

#创建安装目录
mkdir /usr/local/java/
解压文件至安装目录
tar -zxvf jdk-8u231-linux-x64.tar.gz -C /usr/local/java/
#设置环境变量
~/.bashrc中添加
export JAVA_HOME=/usr/local/java/jdk1.8.0_231
export JRE_HOME=$JAVA_HOME/jre
export PATH=$JAVA_HOME/bin:$PATH:$JRE_HOME/bin
#使环境变量生效
source ~/.bashrc

5.安装scala

#创建
概述: 本课程设计旨在通过结合Spring Boot和Hadoop技术,设计和实现一个功能强大的网盘系统。 网盘系统是一种云存储服务,用户可以通过网络上传、下载和管理自己的文件。它提供了方便的文件存储和共享功能,可以随时随地访问和管理文件。通过本课程设计,学生将学习如何利用Spring Boot框架构建一个灵活、高效的Web应用程序,并使用Hadoop分布式文件系统来实现大规模文件存储和管理。 课程设计主要包括以下几个方面: 1. 系统需求分析:对网盘系统的功能和特性进行详细分析和定义,包括用户注册与登录、文件上传与下载、文件管理与分享等。 2. 系统设计:根据需求分析结果,进行系统架构设计、数据库设计等,确定系统的组成部分和交互方式。 3. 环境搭建:安装和配置Spring Boot和Hadoop环境,准备开发所需的工具和资源。 4. 前端开发:使用HTML、CSS、JavaScript等前端技术开发用户界面,实现用户交互和界面展示功能。 5. 后端开发:使用Spring Boot框架开发后端接口,处理用户请求,实现文件管理和存储功能。 6. Hadoop集成:利用Hadoop分布式文件系统,实现文件的分布式存储和管理,提高系统的可扩展性和容错性。 7. 系统测试与优化:对系统进行测试,包括功能测试、性能测试等,并进行优化和改进,确保系统的稳定性和可靠性。 通过完成本课程设计,学生将掌握Spring Boot和Hadoop的开发技术,了解网盘系统的设计和实现原理,并具备开发和部署类似系统的能力。同时,学生还将培养团队协作、问题解决和项目管理等方面的能力,为将来的工作和学习打下坚实的基础。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值