Hive的模式设计

最新推荐文章于 2022-06-16 10:58:24 发布

笑出弧度的程序员

最新推荐文章于 2022-06-16 10:58:24 发布

阅读量178

点赞数

分类专栏：大数据文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40215851/article/details/109233110

版权

一概述

Hive看上去以及实际行为都像一个关系型数据库.用户对如表和列这类术语比较熟悉,而且Hive提供的查询语言和用户之前使用过的SQL方言非常相似.不过Hive实现和使用的方式和传统的关系型数据库是非常不同的.通常,用户视图移植关系型数据库中的模式,而事实上Hive是反模式

1 、按天划分的表

按天划分表就是一种模式,其通常会在表中加入一个时间戳,例如表名为upply_2011_01_01等等.这种每天一张表的方式在数据库领域是反模式的一种方式,但是因为实际情况下数据集增长得很快,这种方式应用还是比较广泛的.

1. 0:jdbc:hive2://hadoopmaster:10000/> CREATE TABLE supply_2011_01_02(id int,part string,quantity int);
2. OK
3. Norows affected(1.279seconds)
4. 0:jdbc:hive2://hadoopmaster:10000/> CREATE TABLE supply_2011_01_03(id int,part string,quantity int);
5. OK
6. Norows affected(0.055seconds)
7. 0:jdbc:hive2://hadoopmaster:10000/> CREATE TABLE supply_2011_01_04(id int,part string,quantity int);
8. OK
9. Norows affected(0.056seconds)
10. 0:jdbc:hive2://hadoopmaster:10000/>
11. 0:jdbc:hive2://hadoopmaster:10000/> select part,quantity supply_2011_01_02 from supply_2011_01_02
12. ..................>unionall
13. ..................>selectpart,quantity supply_2011_01_02fromsupply_2011_01_03
14. ..................>wherequantity<4;

对于Hive,这种情况下应该使用分区表.Hive通过Where子句中的表达式来选择查询所需要的指定分区,这样的查询执行效率高,而且看起来清晰明了:

1. 0:jdbc:hive2://hadoopmaster:10000/> CREATE TABLE supplybypartition (id int,part string,quantity int)
2. ..................>partitionedby(dayint);
3. 0:jdbc:hive2://hadoopmaster:10000/> alter table supplybypartition add partition(day=20110102);
4. OK
5. Norows affected(0.088seconds)
6. 0:jdbc:hive2://hadoopmaster:10000/> alter table supplybypartition add partition(day=20110103);

最低0.47元/天解锁文章

笑出弧度的程序员

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive的模式设计

一概述Hive看上去以及实际行为都像一个关系型数据库.用户对如表和列这类术语比较熟悉,而且Hive提供的查询语言和用户之前使用过的SQL方言非常相似.不过Hive实现和使用的方式和传统的关系型数据库是非常不同的.通常,用户视图移植关系型数据库中的模式,而事实上Hive是反模式1 、按天划分的表按天划分表就是一种模式,其通常会在表中加入一个时间戳,例如表名为upply_2011_01_01等等.这种每天一张表的方式在数据库领域是反模式的一种方式,但是因为实际情况下数据集增长得很快,这种方式应..
复制链接

扫一扫

专栏目录

笑出弧度的程序员 CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

16万+: 周排名

11万+: 总排名

1万+: 访问

: 等级

202: 积分

11: 粉丝

8: 获赞

4: 评论

17: 收藏

私信

关注

热门文章

分类专栏

pig
软考
大数据 12篇
redis 1篇
mybatis 1篇
docker 1篇
面试 1篇
JAVA算法 1篇

最新评论

ubuntu-21.04安装docker
笑出弧度的程序员: 能帮到你就好
ubuntu-21.04安装docker
SelinaKeepsFighting: 感谢博主！照着官方文档的命令sudo apt-get install docker-ce docker-ce-cli containerd.io装了好几次都不行，试了snap那个命令就装上了！
Hive的数据类型、文件格式、存储架构和HQL语法
不正经的kimol君: 学习了，谢谢分享~
Hive的数据类型、文件格式、存储架构和HQL语法
向彪-blockchain: 写得太齐全了，对于初学计算机网络的人说很有用，值得赞一下。方便的话可以加个关注。共同学习！一起进步！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。