在电影库中查找演员评分最高的5部电影

在电影库中查找演员评分最高的5部电影


说在前面的话:其实这个题目有四种办法可以完成,只具体说明两种分别是:
  1. 使用Hdfs的Hbase就可以实现。具体是idea这边写代码将数据写入Hbase(要先定义好表结构),java有提供api用于数据的插入,再去虚拟机进入Hbase使用命令就可以查看数据,此方法要求有一定的编程基础与前面几章的认真熟练
  2. 使用Hive。这个对数据进行初步处理再带入Hive,Hive有提供类似于sql语句的查询。此方法简便
  3. 利用pig
  4. sqoop?

如果是自学很欢迎,如果是课程需要请关闭此页面(针对网络学子,我这样说你懂得!)希望各位好好学习,自己思考。


实验要求

  1. 使用hadoop工具
  2. 使用MapReduce 的 Mapper 编写、序列化的使用和排序
  3. 编写MapReduce程序,按评分从高到低排序该演员参演电影(如果同分则优先列出年份较近的,例如2000年上映的A电影和1995年上映的B电影同分,则排序应该为A,B)。

项目数据源

1.使用json格式文件,内容部分如下

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值