Hive实战：分科汇总求月考平均分

林边上的猫

已于 2024-01-14 20:07:31 修改

阅读量1.2k

点赞数 22

文章标签： hive

于 2024-01-09 11:19:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linlong2003/article/details/135471103

版权

一、实战概述

在这个实战中，我们运用了Hive框架来处理学生的月考成绩数据。具体步骤如下：

准备数据： 我们准备了三个文本文件，分别包含了语文、数学和英语的月考成绩数据，并将这些数据上传到HDFS的指定目录。
启动Hive Metastore服务并连接Hive客户端： 我们启动了Hive Metastore服务，并通过Hive客户端连接到Hive，为后续操作做好准备。
创建分区表： 在Hive中，我们创建了一个名为student_score的分区表，用于存储学生的成绩数据，其中分区字段为科目（subject）。这样的分区设计使得后续查询和分析更加方便。
加载数据到分区表： 按照科目将数据加载到分区表中，分别加载了语文、数学和英语的成绩数据。这样的数据组织方式有助于提高查询效率。
使用Hive SQL进行统计： 利用Hive的SQL语句，我们进行了统计操作，计算每个学生在三个科目上的月考平均分。通过使用AVG函数和ROUND函数，我们得到了每个学生在语文、数学和英语三个科目上的月考平均分，并保留了一位小数。

整个实战过程涉及了Hive表的创建、分区管理、数据加载以及SQL查询等多个环节，充分展示了Hive在大数据处理中的灵活性和便捷性。通过这次实践，我们更深入地理解和掌握了Hive框架在数据分析和查询中的应用。

二、提出任务

统计每个同学各科月考平均分

语文月考成绩 - chinese.txt

1 张晓云 89
2 张晓云 73
3 张晓云 67
4 张晓云 70
5 张晓云 79
6 张晓云 87
7 张晓云 99
8 张晓云 83
9 张晓云 97
10 张晓云 92
11 张晓云 67
12 张晓云 86
1 王东林 49
2 王东林 83
3 王东林 67
4 王东林 49
5 王东林 93
6 王东林 87
7 王东林 65
8 王东林 92

最低0.47元/天解锁文章

林边上的猫

博客等级

码龄3年

11
原创

169
点赞

163
收藏

122
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: MR实战：实现数据去重

下一篇：: Hive实战：学生信息排序

最新评论

Hive实战：词频统计
CSDN-Ada助手: 尊敬的作者，恭喜您撰写了如此精彩的第9篇博客《Hive实战：词频统计》！您对Hive的实战经验分享让我受益匪浅，期待您能继续分享更多关于数据处理的实用技巧和经验。或许下一步可以考虑分享一些高级的数据处理技术或者与其他数据处理工具的对比分析，这对我们这些初学者会有很大的帮助。谢谢您的分享，期待您的下一篇作品！
Hive实战：统计总分与平均分
CSDN-Ada助手: 恭喜你写了第10篇博客！看到你在Hive实战中的探索与总结，我感到非常欣慰。接下来，我建议你可以尝试探索如何在实际应用中优化统计总分与平均分的方法，或者结合其他工具与技术进行更深入的数据分析。祝你继续创作，期待你更多精彩的分享！
Hive实战：网址去重
CSDN-Ada助手: 恭喜您写了第11篇博客！标题“Hive实战：网址去重”听起来很有实用价值。您一直坚持创作，分享您在Hive实战中的经验，让读者受益匪浅。我很高兴看到您在持续不断地为读者提供有用的内容。在下一步的创作中，或许您可以考虑加入一些实例或案例分析，让读者更好地理解如何应用Hive进行网址去重。同时，您也可以分享一些常见问题和解决方案，帮助读者更好地应对实际挑战。我相信您的谦虚态度和专业知识将继续吸引更多读者的关注。期待您下一篇博客的发布！
Hive实战：学生信息排序
CSDN-Ada助手: 恭喜用户写了第9篇博客！标题“Hive实战：学生信息排序”听起来很有趣。您在Hive实践方面的不懈努力令人钦佩。对于下一步的创作建议，或许您可以考虑分享一些关于如何使用Hive进行数据分析或进行更复杂的查询操作的实战经验。期待您的继续创作！谢谢您的分享！
MR实战：统计总分与平均分
CSDN-Ada助手: 恭喜你写了这么有深度的一篇博客！统计总分与平均分的实战内容对于初学者来说非常有帮助。希望你能继续坚持创作，不断分享更多实用的MR实战经验，也可以考虑加入一些实例分析或者案例讨论，让读者更容易理解和应用你的知识。期待你的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。