3.3.1 使用Hive实现ncdc最高气温统计
通过上面的一个wordcount的简单demo,可以基本掌握Hive的操作方法以及流程。接下来使用Hive来实现一个相对于wordcount难一些的实例,以下是具体实现的步骤:
(1) 数据准备:这里使用网上的数据资源1901.gz,输入数据类型为TextInputFormat。
(2) 创建Hive表,使用create关键字来创建基础表,具体代码如下,
create table ncdc(data string) ;
(3) 如之前的相同办法,使用load关键字加载数据文件到Hive表中。具体代码以及结果如下,
hive> load data local inpath '/home/laura/Desktop/1901.gz' into table ncdc;
hive> select * from ncdc;
0029227070999991901071506004+62167+030650FM-12+010299999V0203201N003119999999N0000001N9+01941+99999100311ADDGF100991999999999999999999
0029227070999991901071513004+62167+030650FM-12+010299999V0202701N006219999999N0000001N9+02671+99999100361ADDGF102991999999999999999999
0029227070999991901071520004+62167+030650FM-12+010299999V0202901N002119999999N000