日萌社
人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新)
代码下载链接:
https://pan.baidu.com/s/1VhxRXB63vz_4QZyKVFqoZQ
提取码:2v0l
1.读取的文件中第一行数据:key=偏移量0。value=第一行内容
2.经过了maptask:key=单词:文件名。value=次数1
3.经过了局部合并combiner:key=单词。value=文件名:次数N
4.每个各自的mapreduce中的相同顺序的分区中的数据都传到同一个reducetask中进行全局合并:key=单词。value=文件名:次数N;文件名:次数N;文件名:次数N