Hive是基于Hadoop的一个数据仓库工具,它可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
本质是:将HSQL转化成MapReduce程序。
Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。
元数据包括:表名、表所属的数据库、表的拥有者、列/分区字段、表是否是外部表、表的数据所在目录等。
hive的集合数据类型:STRUCT MAP ARRAY等。
hive的操作其实在字节跳动都能直接通过在页面点击来实现。
语法不讲细节了,我全删了,这些东西用的时候再看就行了,当成工具书,而不是知识记忆。
hadoop之hive
于 2022-05-15 11:16:11 首次发布