Ubuntu从零安装 Hadoop And Spark

最新推荐文章于 2024-03-30 21:27:56 发布

_luckylight

最新推荐文章于 2024-03-30 21:27:56 发布

阅读量2k

点赞数 1

分类专栏： hadoop&spark

本文链接：https://blog.csdn.net/weixin_45573921/article/details/116299620

版权

安装 linux 以Ubuntu为例

选择镜像，虚拟机安装

虚拟机下，直接安装镜像即可，选择好自己的配置，一定要注意路径名选好，而且和你虚拟机的名称匹配，这里我的镜像是 ubuntu-20.04.2.0-desktop-amd64.iso

切换一下中文

在这里插入图片描述
注意重启之后，这一部分保留英文

安装 VMTools

为了方便复制粘贴，建议安装 VMTools，这里不再给出如何安装

提前准备工作

创建用户

首先我们创建hadoop用户，并将/bin/bash 作为他的默认 shell，并设置他的密码以及增加管理员权限
(CTRL + SHIFT + V 是linux 下的粘贴快捷键)

sudo useradd -m hadoop -s /bin/bash
sudo passwd hadoop
sudo adduser hadoop sudo

设置成功后，我们退出，使用 hadoop 用户登录此linux系统

更新apt

sudo apt-get update

安装 Vim

vim 是 vi 的升级版，快捷好用，为了编辑文本，我们可以使用 vim，也可以使用 vi，或者是 gedit，看个人喜好

sudo apt-get install vim

安装 SSH

SSH 为 Secure Shell 的缩写。是较可靠，专为远程登录会话和其他网络服务提供安全性的协议。利用 SSH 协议可以有效防止远程管理过程中的信息泄露问题。
具体查看 SSH的内容可以直接去百度
从客户端来看，SSH提供两种级别的安全验证。
第一种级别（基于口令的安全验证）
只要你知道自己帐号和口令，就可以登录到远程主机。所有传输的数据都会被加密，但是不能保证你正在连接的服务器就是你想连接的服务器。可能会有别的服务器在冒充真正的服务器，也就是受到“中间人”这种方式的攻击。
第二种级别（基于密匙的安全验证）
需要依靠密匙，也就是你必须为自己创建一对密匙，并把公用密匙放在需要访问的服务器上。如果你要连接到SSH服务器上，客户端软件就会向服务器发出请求，请求用你的密匙进行安全验证。服务器收到请求之后，先在该服务器上你的主目录下寻找你的公用密匙，然后把它和你发送过来的公用密匙进行比较。如果两个密匙一致，服务器就用公用密匙加密“质询”（challenge）并把它发送给客户端软件。客户端软件收到“质询”之后就可以用你的私人密匙解密再把它发送给服务器。
用这种方式，你必须知道自己密匙的口令。但是，与第一种级别相比，第二种级别不需要在网络上传送口令。
第二种级别不仅加密所有传送的数据，而且“中间人”这种攻击方式也是不可能的（因为他没有你的私人密匙）。但是整个登录的过程可能需要10秒 [2] 。

集群、单节点模式都需要用到SSH登陆（类似于远程登陆，你可以登录某台Linux电脑，并且在上面运行命令），Ubuntu 默认已安装了 SSH client，此外还需要安装 SSH server：