mapreduce topN算法实现获取前10个音乐数据

最新推荐文章于 2023-01-08 15:09:01 发布

VIP文章 smallpizza

最新推荐文章于 2023-01-08 15:09:01 发布

阅读量4.7k

点赞数 2

分类专栏： hadoop 算法 mapreduce实例文章标签： mapreduce topN-获取前10 算法 topN

本文链接：https://blog.csdn.net/smallpizza/article/details/77950723

版权

上次通过爬虫获取了音乐的数据，并把数据导入到hdfs中，根据他的点击量获取前10个音乐，测试了半天现在终于弄好了，分享一下，如有更好的思路请指教。
部分原始数据（主要用于测试）如下：
字段名说明：
音乐id^歌曲名^链接^音乐类型^歌手^专辑^点击量^收藏量
这里写图片描述
代码如下：

import java.io.IOException;
import java.net.URI;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.LinkedList;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.TreeMap;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Map

最低0.47元/天解锁文章

smallpizza

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
mapreduce topN算法实现获取前10个音乐数据

上次通过爬虫获取了音乐的数据，并把数据导入到hdfs中，根据他的点击量获取前10个音乐，测试了半天现在终于弄好了，分享一下，如有更好的思路请指教。部分原始数据（主要用于测试）如下：代码如下：import java.io.IOException;import java.net.URI;import java.util.Collections;import java.util.Comp
复制链接

扫一扫