Hive小知识点分享

Hive小知识点分享

一、Hive过滤条件 != ’‘ 使用问题
基础数据
在这里插入图片描述
where a != ‘0’
在这里插入图片描述
这里可以看到 为 null的数据丢失了

where a is not null
在这里插入图片描述
二、Reduce参数设置失效问题

调整reduce个数方式1:
set mapred.reduce.tasks = 5
调整reduce个数方式2:
set hive.exec.reducers.bytes.per.reducer=500000000

有以下3种情况会导致reduce个数为1
设置为5个
在这里插入图片描述
未使用group by进行汇总
在这里插入图片描述
使用了order by
在这里插入图片描述
总结:
1、没有group by 进行汇总
2、使用了order by
3、有笛卡尔积

三、Hive模糊Join的使用
使用函数 locat(’string‘,’string‘) return int
在这里插入图片描述
在这里插入图片描述
四、Hive数据倾斜参数的使用问题

set hive.groupby.skewindata=true
数据倾斜参数开启后,注意不可以使用两个distinct
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值