为了提高动手能力,这学期选了一门课,大数据实践。
从装虚拟机,到配置集群,到装hadoop,到跑通第一个小程序WordCount,遇到不少大大小小的坑,特别写下一篇博客,记录这些问题以及解决办法,希望能帮助到大家。
首先,整体流程是这样的,需要在windows上下载一个虚拟机VMware,然后在虚拟机里装linux系统,为了搭建集群,我装了3台虚拟机,一个master,两个slave。接着就开始三个虚拟机上的各种配置,装hadoop及配置,尝试跑一个小程序。
电脑配置:
这里主要指内存,为了3台虚拟机都跑起来,至少要8G,不够的可以尝试加个内存条,我就是这么干的。。
虚拟机的选择:
一开始,我从官网上选择了VMware Workstation play 12,发现在配置网络时,找不到【虚拟机网络编辑器】。关于这个问题,网上有说需要下载什么插件才能显示。怎么能那么麻烦呢!卸!重新选择了VMware Workstation 11,一路顺畅的不得了。有人说出现了卸载不干净的问题,可以下载一个vmware_install_cleaner帮助删除虚拟机。
linux系统的选择:
我选择的是CentOS7,也有很多人有ubuntu,这个看个人喜好,有些命令会些许不同,没有什么大影响。
安装过程:
1. 安装CentOS时,尽量选择窗口界面&#x