1. spark 集群环境
spark的安装配置参考《Spark 安装》。本环境是用了6台工作站,规划如下:
序号 | 主机名 | IP | 用途 |
1 | bdml-c01 | 192.168.200.170 | 客户端 |
2 | bdml-m01 | 192.168.200.171 | namenode resourcemanager master |
3 | bdml-s01 | 192.168.200.172 | datanode nodemanager worker |
4 | bdml-s01 | 192.168.200.173 | datanode nodemanager worker |
5 | bdml-s01 | 192.168.200.174 | datanode nodemanager worker |
6 | bdml-s01 | 192.168.200.175 | datanode nodemanager worker |
TensorflowOnSpark 的安装参考了《Getting Started TensorFlowOnSpark on Hadoop Cluster》。这篇文章也有误导,以至于我专门装了一个虚拟机去编译tensorflow,实际上是如果你不需要RDMA这个特性的话,完全不需要编译。为编译tensorflow,配置google的Bazel编译环境,费了不少时间。
2. 软件版本
redhat 7.2 / centOS 7.2
hadoop