由于用到了虚拟机来做多台机器联机的分布式,所以,关键的一点就是确保这几台虚拟机间的网络通信。首先我们要在vmware fusion中建立四台ubuntu 16.04版本的Linux系统虚拟机,然后进行相关的网络设置。
值得借鉴的几篇有关Mac上vmware fusion里,几台虚拟机之间各自的网络适配器(网卡)设置的参考方法可以从以下的这个URL中找到:
http://blog.csdn.net/YooFale/article/details/78223453vmware fusion软件里的配置文件存放位置为:
/Library/Preferences/VMware\ Fusion
。在这里有一个
networking
文件,在这里可以看到子网和子网掩码,开启和关闭DHCP(Dynamic Host Configuration Protocol,动态主机配置协议),以及NAT(Network Address Translation,网络地址转换)。
但是最重要的是这个目录下的networking文件是自动生成的,只要自己配置好网络以及相关网络适配器(网卡),这个文件的内容也会相应的改变。这里提到的方法仅用来做相应的强制性改变......
在配置好相应的网络设置后,就可以按照《Hadoop + Spark 大数据巨量分析与机器学习整合开发实战》这本书进行相关的集群搭建和配置。可以在URL:https://item.jd.com/12