前言
大三开始,开设了Hadoop课(早就想跃跃欲试入大数据坑了?)。
起步学Hadoop?,Hadoop的搭建真是个坑。有三种搭建方式/运行模式,单机(不能用HDFS,这算个啥)、伪分布式(大四秋招出去面试,整个这会中?)、全分布式。OK,就是这个全分布模式了,但这也是最近遇到的的痛点。
首先,说服室友咱们别完玩LOL/NBA2K/守望先锋/斗鱼直播电脑上都同时安个Hadoop,我master,你们slave开整吧这是不可能的。所以,只能安个虚拟机Vmware/VirtualBox(无论你系统Win10还是Linux),然后安3+个linux,配好Hadoop。可鸡肋地是这样整,在虚拟机里操作起来太卡了,想想在虚拟机里的IDE里写长短长短的java代码,体验贼差。
所以,我就想寻思,看能不能找点更好的方法。
Docker,我google到了这个方法,准备试试。如果可行,我就把方案详细的整理出来,供大家参考。
Hadoop? in Docker?,参考索引
基于Docker搭建Hadoop集群之升级版 :https://kiwenlau.com/2016/06/12/160612-hadoop-cluster-docker-update/