前言:最近几年工作,一直围绕着大数据平台进行业务开发,主流的Hadoop/Hive/Spark/Storm/Kafka/Flink等基础设施都接触过。但是生产的集群无法如测试集群般进行各种自我学习和测试,所以个人就多次尝试搭建测试集群,从一开始跑cloudera的quickstart-vm到独自在阿里云上用多台VM搭建过分布式环境,但是往往也是随着机器的下线,下次要重写搭建集群就又需要重头来,既费时又费力。最近由于工作原因,需要重新搭建一个完整大数据测试环境,故而决定从头开始,通过Ansible Playbook来将这些常用大数据组件集群的搭建工作脚本化和可重用。
“使用Ansible搭建分布式大数据基础环境”文章完整包含了如何使用Ansible这一分布式运维利器,来帮我们快速搭建Hadoop2/Spark2/Hive2/ZooKeeper3/Flink1.7/ElasticSearch5等一整套大数据解决方案。本篇是系列文章的第六篇。更多后续文章尽请关注。