Hive实战:分科汇总求月考平均分

一、实战概述

在这个实战中,我们运用了Hive框架来处理学生的月考成绩数据。具体步骤如下:

  1. 准备数据: 我们准备了三个文本文件,分别包含了语文、数学和英语的月考成绩数据,并将这些数据上传到HDFS的指定目录。

  2. 启动Hive Metastore服务并连接Hive客户端: 我们启动了Hive Metastore服务,并通过Hive客户端连接到Hive,为后续操作做好准备。

  3. 创建分区表: 在Hive中,我们创建了一个名为student_score的分区表,用于存储学生的成绩数据,其中分区字段为科目(subject)。这样的分区设计使得后续查询和分析更加方便。

  4. 加载数据到分区表: 按照科目将数据加载到分区表中,分别加载了语文、数学和英语的成绩数据。这样的数据组织方式有助于提高查询效率。

  5. 使用Hive SQL进行统计: 利用Hive的SQL语句,我们进行了统计操作,计算每个学生在三个科目上的月考平均分。通过使用AVG函数和ROUND函数,我们得到了每个学生在语文、数学和英语三个科目上的月考平均分,并保留了一位小数。

整个实战过程涉及了Hive表的创建、分区管理、数据加载以及SQL查询等多个环节,充分展示了Hive在大数据处理中的灵活性和便捷性。通过这次实践,我们更深入地理解和掌握了Hive框架在数据分析和查询中的应用。

二、提出任务

统计每个同学各科月考平均分

  • 语文月考成绩 - chinese.txt
1 张晓云 89
2 张晓云 73
3 张晓云 67
4 张晓云 70
5 张晓云 79
6 张晓云 87
7 张晓云 99
8 张晓云 83
9 张晓云 97
10 张晓云 92
11 张晓云 67
12 张晓云 86
1 王东林 49
2 王东林 83
3 王东林 67
4 王东林 49
5 王东林 93
6 王东林 87
7 王东林 65
8 王东林 92
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值