![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 70
西北峰转东风
这个作者很懒,什么都没留下…
展开
-
大数据清洗、统计案例(下)
2)“星级6、评论数11、评分10、房间数8”这4个字段有一个为NULL;请删除满足以上三个条件的记录,并打印每类不符合要求的记录的数量;1)每条记录如果为NULL的字段数量大于等3;3)重复的记录,将重复的去掉;原创 2023-08-05 20:37:52 · 138 阅读 · 1 评论 -
大数据环境安装配置
【代码】大数据环境安装配置。原创 2023-08-05 14:13:06 · 202 阅读 · 1 评论 -
大数据清洗、统计案例(上)
2)“星级6、评论数11、评分10、房间数8”这4个字段有一个为NULL;请删除满足以上三个条件的记录,并打印每类不符合要求的记录的数量;2.请根据数据清洗的输出数据集,编写Mapreduce程序。2)以省份房间数量降序排列并输出前10条统计结果。1)每条记录如果为NULL的字段数量大于等3;贵州 贵阳 1234 123456.0。1)统计各省份的酒店数量和房间数量,3)重复的记录,将重复的去掉;原创 2023-08-05 19:25:46 · 234 阅读 · 1 评论