在开始具体操作之前,需要首先选择一个合适的操作系统。尽管Hadoop本身可以运行在Linux、Windows以及其他一些类UNIX系统上,但是Hadoop官方真正支持的作业平台只有Linux。这里选择Linux作为系统平台,来演示在计算机上如何安装Hadoop、运行程序并得到最终结果。
1.Linux系统的安装
选择免费的Ubuntu桌面版作为安装的操作系统,读者可以到网络上下载Ubuntu系统镜像文件(https://www.ubuntu.org.cn/download/desktop)进行安装。这里选择的是乌班图麒麟16.04版本(ubuntukylin-16.04-desktop-amd64.iso)
在VMware中建立Ubuntukylin的虚拟机
2.创建Hadoop用户
(1)如果你安装 UbuntuKylin的时候不是用的 “hadoop” 用户,那么需要增加一个名为 hadoop 的用户。
首先按 ctrl+alt+t 打开终端窗口,输入如下命令创建新用户 :
sudo useradd -m hadoop -s /bin/bash
接着使用如下命令设置密码,可简单设置为 hadoop,按提示输入两次密码:
sudo passwd hadoop
(2)更新apt
用 hadoop 用户登录后,我们先更新一下 apt,后续我们使用 apt 安装软件,如果没更新可能有一些软件安装不了。按 ctrl+alt+t 打开终端窗口,执行如下命令:
sudo apt-get update
后续需要更改一些配置文件,安装vim:
sudo apt-get install vim
安装软件时若需要确认,在提示处输入 y 即可。
3.安装SSH、配置SSH无密码登陆
谈到SSH,简单说一下SSH是什么。