mapreduce topN算法实现 获取前10个音乐数据
上次通过爬虫获取了音乐的数据,并把数据导入到hdfs中,根据他的点击量获取前10个音乐,测试了半天现在终于弄好了,分享一下,如有更好的思路请指教。
部分原始数据(主要用于测试)如下:
代码如下:import java.io.IOException;
import java.net.URI;
import java.util.Collections;
import java.util.Comp
原创
2017-09-12 22:18:42 ·
4806 阅读 ·
0 评论