任务15：使用Hive进行全国气象数据分析_基于hive的气象数据分析-CSDN博客

本文链接：https://blog.csdn.net/bangbinbing/article/details/135541427

本文详细介绍了如何使用Hive进行天气数据分析，包括创建外部表、处理CSV数据、统计2022年各省份平均气温、风速、降水量，以及为后续气温预测准备数据。通过实例展示了如何使用Hive进行基础表的创建和复杂查询以提取所需信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

任务描述

知识点：

重点：

内容：

任务指导

1）统计2022年每个月各省份的平均气温及平均风速

创建china_map表，表字段包含：月份，省份，平均气温，平均风速
统计2022年每个月各省份的平均气温及平均风速，由于气温与风速数据中存在缺失值"-9999"，所以统计平均气温和平均风速时只统计不等于(<>)"-9999"的数据

2）统计2022年每个月平均降水量TOP10的城市

创建city_precipitation_top10表，表字段包含：月份，城市，平均降水量（6小时）
统计2022年每个月平均降水量TOP10的城市。本次查询通过两次子查询进行统计，通过第一次子查询获取2022年每个月各个城市的平均降水量（原数据中关于降水量的有两个字段“precipitation_1 string”和“precipitation_6 string”，分别为1小时内的降水量与6小时内的降水量，此时我们统计各城市平均6小时内的降水量），基于第一次子查询所得的结果，使用row_number()函数对各城市的平均降水量进行排名，进行第二次子查询，通过两次子查询分别获取到平均降水量以及排名，最后使用最外层查询根据排名取得前十的城市