Hive 严格模式设置

houzhizhen

已于 2024-02-25 12:00:02 修改

阅读量973

点赞数 3

分类专栏： hive 文章标签： hive hadoop 数据仓库

于 2024-02-25 11:59:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/houzhizhen/article/details/136280712

版权

hive 专栏收录该内容

154 篇文章 15 订阅

订阅专栏

Hive 在早期使用参数 hive.mapred.mode 来决定是否执行严格模式, 其值为 strict 或者 nostrict. 当其值为 strict 时，执行严格模式，如从分区表查询时，过滤条件必须有分区字段。

在 Hive 3.1.3 中，因为 hive.mapred.mode 比较粗暴，为了能更好的在不同地方是否严格模式，在不同的地方用各自的参数。

为了使用不同的参数，hive.mapred.mode 已经被废弃，不能设置，如果设置了，则以 hive.mapred.mode 值为准，新的参数不生效。

新的参数值为 boolean 型, 值可以为 true 和 false。

严格模式的参数如下：

1. hive.strict.checks.orderby.no.limit

是否禁止 order by 后没有 limit 的操作。
注意：当前检查不考虑数据量，仅从 query 的语法上检查。

示例：
当 hive.strict.checks.orderby.no.limit 为 true 时，以下查询不能执行。

select c1, c2 from t order by c1;

必须有 limit 部分，如以下 query 可以执行。

select c1, c2 from t order by c1 limit 100;

2. hive.strict.checks.no.partition.filter

是否禁止查询分区表没有分区字段的过滤操作。
注意：当前检查不考虑数据量，仅从 query 的语法上检查。

如表 t 有分区字段 pc1, pc2。

当 hive.strict.checks.no.partition.filter=true 时，以下查询不能执行。

select c1, sum(c2) 
from t 
where c3 > 100 
group by c1 ;

必须加上至少一个分区字段, 如以下 query 可以执行。

select c1, sum(c2) 
from t 
where c3 > 100 
    and pt1='aaa' 
group by c1 ;

3. hive.strict.checks.type.safety

执行严格的类型检查，当开启时，禁止以下操作：
bigint 和 string 类型的比较。
bigint 和 double 类型的比较。

开启时，执行以下 Query 会报错。

create table t1(c_bigint bigint, c_string string, c_double double);

开启时，执行以下查询会有警告WARNING: Comparing a bigint and a double may result in a loss of precision.：

select * from t1 where c_bigint > c_double;

4. hive.strict.checks.cartesian.product

开启时，禁止迪卡尔积关联。

select * from t1 join t2;

需要加上关联条件，可以用 on 或者 where 部分都可以。
如以下 Query 都可以

select * from t1 join t2 
on t1.c1=t2.c1;

select * from t1 join t2 
where t1.c1=t2.c1;

5. hive.strict.checks.bucketing

开启时，禁用对 bucketing 表执行 load into 操作。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Hive 严格模式设置

Hive 在早期使用参数来决定是否执行严格模式, 其值为 strict 或者 nostrict. 当其值为strict时，执行严格模式，如从分区表查询时，过滤条件必须有分区字段。在 Hive 3.1.3 中，因为 hive.mapred.mode 比较粗暴，为了能更好的在不同地方是否严格模式，在不同的地方用各自的参数。为了使用不同的参数，hive.mapred.mode 已经被废弃，不能设置，如果设置了，则以 hive.mapred.mode 值为准，新的参数不生效。
复制链接

扫一扫

专栏目录

houzhizhen CSDN认证博客专家 CSDN认证企业博客

码龄18年

629: 原创

3万+: 周排名

2476: 总排名

122万+: 访问

: 等级

1万+: 积分

838: 粉丝

1148: 获赞

73: 评论

1713: 收藏

私信

关注

热门文章

分类专栏

最新评论

Kubernetes 文档 / 概念 / 工作负载 / 工作负载管理 / StatefulSet
ha_lydms: 牛牛牛！太全面了，以后要用，忘记了直接来这里找表情包
Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配
全栈小5: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。【Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配，博主这篇文章，值得一看】
Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配
国人开源: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Kubernetes 文档 / 概念 / Kubernetes 架构 / 关于 cgroup v2
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Kubernetes 文档 / 概念 / 概述 / Kubernetes 对象
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。