Hive
文章平均质量分 94
Hive数据仓库相关内容介绍
夜夜流光相皎洁_小宁
九零后技术大叔,从事信息安全行业,架构师,JavaWeb、大数据、移动应用开发,关注移动应用安全、大数据安全、云原生安全、网络安全渗透、攻防等领域;喜欢交流和分享,喜欢读书,什么书都会读一读,比较杂;闲暇时间喜欢做技术总结,喜欢探索技术、解锁新技能。
展开
-
Hive 的权限管理
hive自身支持三种权限管理模型,默认情况下是不开启的,这样会导致所有的用户都具有相同的权限,且默认都是超级管理员,超管对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的,今天我们就来探究下Hive的权限管理原创 2023-09-21 11:01:22 · 11497 阅读 · 2 评论 -
Hive 优化建议与策略
为啥Hive需要优化? Hive的执行依赖于底层的MapReduce作业,因此对Hadoop作业的优化或者MapReduce作业的调优对于Hive 查询性能有较大提高,本问介绍了工作中经常会用到的hive相关优化技巧原创 2023-09-20 21:46:08 · 902 阅读 · 2 评论 -
Hive 的函数介绍
hive中的函数其实与Java与MySQL中的函数概念一样,封装了一段实现某些功能的代码,今天我们来学习下Hive 相关的函数,我们自己也学着通过代码自定义UDF和UDTF函数原创 2023-09-20 18:17:40 · 9448 阅读 · 1 评论 -
Hive的分区和分桶
为了提高查询数据的效率,Hive 提供了表分区机制。分区表基于分区键把具有相同分区键的数据存储在一个目录下,在查询某一个分区的数据的时候,只需要查询相对应目录下的数据,而不会执行全表扫描,也就是说,Hive 在查询的时候会进行分区剪裁。每个表可以有一个或多个分区键。Hive 可以对每一个表或者是分区,进一步组织成桶,也就是说桶是更为细粒度的数据范围划分。Hive 是针对表的某一列进行分桶。Hive 采用对表的列值进行哈希计算,然后除以桶的个数求余的方式决定该条记录存放在哪个桶中。分桶的好处是可以获得更高的查原创 2023-09-20 15:53:33 · 9684 阅读 · 1 评论 -
Hive的基本SQL操作(DDL篇)
Hive SQL(HQL)与SQL的语法大同小异,基本上是相通的,学过SQL的使用者可以无痛使用Hive SQL。只不过在学习HQL语法的时候,特别要注意Hive自己特有的语法知识点,今天我们就来学习下Hive SQL的DDL语句原创 2023-09-20 15:19:47 · 10133 阅读 · 3 评论 -
一篇文章教会你搭建Hive分布式集群
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。在大数据技术生态体系中扮演着重要的角色,今天我们就通过一篇文章来教会你如何搭建部署Hive分布式集群。原创 2023-09-20 14:23:57 · 10382 阅读 · 2 评论 -
Hive 数据仓库介绍
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。原创 2023-09-19 22:29:07 · 10106 阅读 · 2 评论