注:hadoop基于2.7.5;spark基于2.3.1-hadoop2.7-scala2.11.8 1.hadoop处理小文件(提升mapreduce性能,没有解决namenode内存问题) 2.spark处理小文件