1、Hadoop中实现了MapReduce和HDFS两大功能,是Hadoop可以独立部署为一个分布式的计算平台。
2、MapReduce和HDFS可以相互独立启动。也就是说可以独立启动MapReduce实现分布式计算;独立启动HDFS提供分布式文件系统。
3、实现MapReduce的服务器群组可以和提供分布式数据库服务和分布式文件服务的系统分开或合并,相互不影响。
4、MapReduce使用其他文件系统或数据库系统进行分布式计算,需要其他系统提供JAVA访问的API。开发人员需要实现Map、Reduce、InputSplit、InputFormat、RecordReader、OutputFormat、RecordWriter接口。
5、由于MapReduce依赖于Hadoop提供的同步、通讯、协作等机制。所以将MapReduce脱离Hadoop比较困难,并且如果脱离了,就是一个Map-Reduce算法了。