作者刚开始学习Hadoop,本案例适合刚接触Hadoop,并且只有一台电脑的初学者。我们将Hadoop搭建在WINDOWS虚拟机上,虚拟机采用VirtualBox,在虚拟机中安装Linux环境。
一、下载并安装VirtualBox
大多数初学者并没有条件将Hadoop布置在真实的集群环境中,所以我们采用虚拟机模拟多台电脑的集群环境。虽然这么做无法获得真正分布式计算所带来的效率提升,但整体的操作步骤是相同的。虚拟机可以很好的降低我们学习的门槛,以后真正需要使用Hadoop时完全可以将虚拟机中的操作进行复现。
1.下载安装
首先我们从VirtualBox(以下简称为VBox)的官网进行下载,官网网址为www.virtualbox.org/wiki/Downloads。建议下载6.0以上版本,5.0版本在启动时有可能会报错。下载后,选择合适的安装路径后所有的界面都点Next即可,最后点击Install进行安装,结束后点击Finish。
2.创建虚拟机
点击管理→全局设定,设置合适的“默认虚拟电脑位置”,这个位置将用来存储我们搭建好虚拟机的所有文件。
设置好后返回主界面点击“新建”,设置系统名称,“类型”选择Linux,“版本”选择Ubuntu(64-bit),点击下一步进行内存设置。内存根据自己电脑情况设置,这个系统将用来搭建Single Node Cluster