背景:基于阿里云的3台ECS云服务器搭建了在线教育平台的离线数据仓库,本文仅用于记录最终的效果,从0到1的实现过程后续进行补充,由于抢占式实例的云服务器按量进行每小时计费,为了避免持续的收费,所以我急于展示结果,也就有了此文(数仓已经搭建完成,我自然可以停止它)。
1 阿里云服务器的启动
进入控制台后,选择「启动」待启动的三台云服务器,启动时私有IP地址不会发生变化,而公有IP地址会发生变化,此外,我选用的服务器配置是3台2核8G、硬盘大小为40GB的服务器,如下(当然IP地址遮住了哈):
随后,需要在终端(Mac OS)用命令去本地环境下修改三台服务器的公有IP地址,命令为sudo vim /etc/hosts
。
2 集群的启动
利用SecureCRT远程连接3台云服务器,依次启动zookeeper、Hadoop、metastore、hiveserver2,随后利用Hue进行可视化展示:
- zookeeper的启动,用于高可用环境下NameNode的故障处理,三台云服务器都需要启动,如下: