大数据常见函数及案例实战

本文介绍了Hive中的NVL函数用于空值处理,时间类函数如date_format、date_add等,CASE WHEN表达式进行条件查询,以及行转列、列转行的转换方法,并结合窗口函数进行数据分析,包括数据准备、查询示例和需求实现。
摘要由CSDN通过智能技术生成


空字段赋值

1)函数说明

NVL:给值为 NULL 的数据赋值,它的格式是 NVL( string1, replace_with)。

它的功能是如果string1 为 NULL,则 NVL 函数返回 replace_with 的值,否则返回 string1 的值,如果两个参数都为 NULL ,则返回 NULL。

2)数据准备:采用emp表
emp.empno  emp.ename  emp.job  emp.mgr  emp.hiredate  emp.sal  emp.comm  emp.deptno
7369  SMITH  CLERK  7902  1980-12-17  800.0  NULL  20
7499  ALLEN  SALESMAN  7698  1981-2-20  1600.0  300.0  30
7521  WARD  SALESMAN  7698  1981-2-22  1250.0  500.0  30
7566  JONES  MANAGER  7839  1981-4-2  2975.0  NULL  20
7654  MARTIN  SALESMAN  7698  1981-9-28  1250.0  1400.0  30
7698  BLAKE  MANAGER  7839  1981-5-1  2850.0  NULL  30
7782  CLARK  MANAGER  7839  1981-6-9  2450.0  NULL  10
7788  SCOTT  ANALYST  7566  1987-4-19  3000.0  NULL  20
7839  KING  PRESIDENT  NULL  1981-11-17  5000.0  NULL  10
7844  TURNER  SALESMAN  7698  1981-9-8  1500.0  0.0  30
7876  ADAMS  CLERK  7788  1987-5-23  1100.0  NULL  20
7900  JAMES  CLERK  7698  1981-12-3  950.0  NULL  30
7902  FORD  ANALYST  7566  1981-12-3  3000.0  NULL  20
7934  MILLER  CLERK  7782  1982-1-23  1300.0  NULL  10
3)查询:如果员工的 comm 为 NULL,则用-1 代替
hive (default)> select comm,nvl(comm,-1) from emp;
4)查询:如果员工的 comm 为 NULL,则用领导 id 代替
hive (default)> select mgr,comm,nvl(comm,mgr) from emp;

时间类

1)date_format:格式化时间
hive (default)> select date_format('2019-06-29','yyyy-MM-dd');
2)date_add:时间跟天数相加
hive (default)> select date_add('2019-06-29',5);hive (default)> select date_add(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值