HIVE
文章平均质量分 58
Kilig*
这个作者很懒,什么都没留下…
展开
-
HIVE相关操作
HIVE有两种启动方式。原创 2023-04-11 19:16:44 · 607 阅读 · 0 评论 -
HIVE部署
HIVE本身是单机的,只需要部署在一台服务器即可。但他可以提交分布式的MapReduce程序运行。原创 2023-04-11 11:27:37 · 81 阅读 · 3 评论 -
HIVE学习记录-元数据
HIVE的元数据包括database、table、表的位置、类型、属性、字段等信息。Metadata储存在关系型数据库中,比如HIVE内置的Derby或者MySQL(第三方)中。HIVE元数据服务,管理Metadata元数据,控制客户端对元数据的访问。原创 2023-04-08 18:32:27 · 121 阅读 · 0 评论 -
HIVE学习记录-数据模型以及和SQL的对比
Table-表Partition-分区HIVE的一种优化手段,根据分区列(比如日期“day”)的值将表划分为不同分区,可以提高查询效率。各个分区以子文件夹的形式存在。一个文件夹表示一个分区Bucket-分桶HIVE的一种优化手段,根据表中的字段,比如“编号ID”经过Hash计算将数据继续划分为若干个小文件。分桶与不分桶的对比。原创 2023-04-07 20:58:39 · 127 阅读 · 0 评论 -
HIVE学习记录-基本概念
易于上手、学习开发成本低、提高开发效率,可以让用户专注于编写HQL,将简单的HQL语句转化为复杂的MapReduce在HDFS文件系统上执行。:用于储存分析的数据系统,面向数据分析(辅助决策)。数据仓库本身不生产数据,也不消费任何数据,只是用来储存,管理数据。并不是取代数据库,而是一个专业的、集成的数据分析平台。比如关系型数据库(SQL),为了捕获数据产生的。面向单个部门,数据仓库的子集,面向单个部门。比如HIVE,数据分析,为了分析数据产生的。Processing 联机。Processing 联机。原创 2023-04-07 20:24:10 · 450 阅读 · 0 评论