【头歌】Hive内置函数 - 详解

Hive函数实战：从查询到排序

最新推荐文章于 2025-03-01 10:20:48 发布

原创

最新推荐文章于 2025-03-01 10:20:48 发布 · 5.8k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#hive #mysql #hadoop

本文是一系列Hive函数使用教程，包括函数查询、描述、调用，Hive标准函数，聚合函数，日期函数，表生成函数的使用，以及如何进行分组排序取TopN的操作。通过实例详细解释了每个函数的用法和实践步骤。

【提示】点击每一关参考答案可以快速复制。

第1关：函数的查询、描述和调用

任务描述

本关任务：查一下add函数的用法，并尝试使用它。

相关知识

本关我们将学习Hive中函数的基本用法。

函数的查询

Hive中的函数比较多，我们不需要记住所有函数的意义和用法。当需要使用某个函数的时候，可以直接在Hive交互界面查询。

首先，在命令行输入hive进入交互模式，如下：（以下所有图片中的红色箭头均表示用户的输入）

成功进入后如下：

查看Hive的所有函数

查看所有函数的命令是：

show functions

结果如下：

当然，结果非常多，上图只展示了极少的部分。

查看某个函数的含义和用法

以上图中的abs函数为例子：查看函数含义：

desc function abs

结果如下：

上面的英文的意思是：abs函数的含义是返回x的绝对值。

我们还可以看下这个函数使用的例子：

desc extended function abs

到这里，这个函数是干什么的、以及怎么用，就一目了然了。

函数的调用

上面给出了函数具体使用的例子，但是我们毕竟没有亲自用过，俗话说“实践出真知”，那就试用下abs函数。

一些不得不做的准备工作

首先，例子里给的src其实是一个表，所以我们需要先建一个表，名字就叫test_table吧，没必要和例子一模一样：

create table test_table(id int,name string) row format delimited fields terminated by '\t' lines terminated by '\n' stored as textfile;

然后，往表里插入一些数据，要不然select查不出任何东西。

hive没有insert关键字，插入数据需要从磁盘中导入。在当前命令行所在的目录下新建一个a.txt文件，内容如下：

一行内的分隔符是\t，这个分隔符我们在建表的时候实际上已经指定了。

然后执行下面的语句就导入了：

load data local inpath 'a.txt' into table test_table;

通过

select * from test_table

看下有没有导入成功：

我这里是成功了，如果没有成功，你得重新尝试。

开始实践

一番折腾后，现在，可以来试试abs函数了：

select abs(0) from test_table limit 1;

看下输出：

没错，结果是0。

再来看下负数的abs，如下：

select abs(-2) from test_table limit 1;

输出：

这一关是教大家如何去了解并实践一个函数，就不再给例子了，需要大家多多尝试。

编程要求

根据提示，在右侧编辑器Begin和End之间补充代码，使用Hive中的ceil函数求数字66666的ceil的结果，我们已经准备了表test_table，而且表中已经有若干的数据。

测试说明

平台会执行你补充的sql文件，然后将输出和正确的结果进行对比，从而判断你的程序是否正确。

无输入，正确的输出如下：

参考答案

#代码文件


drop table if exists test_table;
create table test_table(id int,name string) row format delimited fields terminated by '\t' lines terminated by '\n' stored as textfile;
load data local inpath 'step1/data.txt' into table test_table;

--------- Begin ---------
select ceil(66666) from test_table limit 1;
--------- End ---------

第2关：Hive标准函数

任务描述

本关任务：按要求查询数据。

相关知识

本关将学习Hive中的一些最基本的函数。

先准备一些数据

我们需要先准备一些数据，使用的表还是第一关中介绍的test_table表，向其中导入如下的数据，导入方法见第一关。

第一列对应test_table表的id，第二列对应name。

关系函数

关系函数作用在where条件子句中，用来筛选符合要求的列。

相等关系

判断两个值是否相等使用=即可，如下，查找id等于15的数据：

select * from test_table where id=15;

结果如下：（以下所有截图中的红色箭头均为后期添加，表示运行的结果）。

查找名字为tom的数据：

select * from test_table where name='tom';

字符串类型必须放在单引号中。

结果如下：

不等关系

不等于使用<>来表示，比如查找所有id不等于100的数据：

select * from test_table where id<>100;

结果如下：

其它的诸如大于、小于、大于等于，符号和数学基本相同，用法和上面相同。

like比较

对于字符串来说，很多时候还需要用到正则表达式的比较，在hive中通过like关键字来实现：

select * from test_table where name like

最低0.47元/天解锁文章