1.Purpose
使用CLI MiniCluster,用户使用一个能够简单使用一个命令启动和停止一个单节点的Hadoop集群,在不需要任何环境变量或者管理配置文件。CLI MiniCluter开始一个YARN/MapReduce & HDFS集群。
这对于用户想快速尝试一个真正的Hadoop集群或者测试非Java项目依靠有意义的Hadoop功能是很有用的。
2.Hadoop Tarball
你应该从版本中获取Hadoop源代码。也可以直接从源创建一个源代码:
$ mvn clean install -DskipTests $ mvn package -Pdist -Dtar -DskipTests -Dmaven.javadoc.skip注意:你将会需要 protoc 2.5.0 执行
这个源代码应该在 hadoop-dist/target目录是可用的。
3.Running the MiniCluster
从获取的源代码的内部根目录,你可以启动CLI MiniCluster使用以下命令:
$ bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.3.0-tests.jar minicluster -rmport RM_PORT -jhsport JHS_PORT
在上述命令,RM_PORT和JHS_PORT应该被替换为用户选择的端口号。如果没有指定,随机的自由端口号将被使用。
有一些命令行参数,用户可以控制那个服务开始,并通过其他的配置属性。有效的命令行参数:
$ -D <property=value> Options to pass into configuration object
$ -datanodes <arg> How many datanodes to start(default 1)
$ -format Format the DFS(default false)
$ -help Prints option help
$ -jhsport <arg> JobHistoryServer port(default 0--we choose)
$ -namenode <arg> URL of the namenode (default is either the DFS cluster or a temporary dir)
$ -nnport <arg> NameNode port(default 0--we choose)
$ -nodemanagers <arg> How many nodemanagers to start (default 1)
$ -nodfs Don't start a mini DFS cluster
$ -nomr Don't start a mini MR cluster
$ -rmport <arg> ResourceManager port (default 0--we choose)
$ -writeConfig <path> Save configuration to this XML file.
$ -wirteDetails <path> Write basic information to this JSON file.
为了列出有效参数的列表,用户可以使用命令 -help 论述上面命令。