Hadoop hdfs: 基于gfs, 解决硬盘不够用和安全性问题.2. 冗余度为三份.特点:水平复制,解决效率问题.以数据块形式存在,(hadoop 1.x版本64兆。hadoop 2.x版本,128兆)。hadoop安装模式:本地模式:需要一台主机.伪分布式模式:需要一台主机.全分布模式:需要三台主机. MapReduce. 解决大量数据的计算问题。特点:分布式,拆大为小,计算后合并,计算的数据不能是Java的数据类型必须是哈杜普的数据类型。两个阶段:(Reduce的输入是map的输出,Map和reduce是两个Java程序)map阶段:拆分.