一:背景
求平均数是MapReduce比较常见的算法,求平均数的算法也比较简单,一种思路是Map端读取数据,Reduce端汇总并且统计记录数,然后作商即可。
二:技术实现
#需求:现有成绩单如下,求出每个同学的平均成绩
小民 语文 80
小民 数学 98
小民 英语 89
小芳 语文 88
小芳 数学 99
小芳 英语 90
实现代码:
public class AverageTest {
// 定义输入路径
private static final String INPUT_PATH = "hdfs://liaozhongmin:9000/average_file";
// 定义输出路径
private static final String OUT_PATH = "hdfs://liaozhongmin:9000/out";
public static void main(String[] args) {
try {
// 创建配置信息
Configuration conf = new Configuration();
// 创建文件系统
FileSystem fileSystem