- 博客(8)
- 收藏
- 关注
原创 Hive——窗口
窗口的定义由窗口子句“[]" 来实现,用于进一步细分分组结果并应用分析函数。窗口子句不支持的函数包括: RANK、NTILE、DENSE RANK、CUME DIST、PERCENT RANK、LEAD及LAG。窗口分为两类:行类型窗口(行窗口)与范围类型窗口(范围窗口)。
2024-06-22 18:23:59 249
原创 Hive 基本操作命令与介绍
Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言HiveQL来对存储在Hadoop集群中的数据进行查询和分析。
2024-03-29 15:01:12 1395 1
原创 Hive 元数据
元数据是描述数据的数据,它提供关于数据的信息,帮助人们理解和管理数据。元数据可以包括各种信息,如数据的来源、格式、结构、含义、关系以及处理方式等。在计算机科学和信息管理领域,元数据通常用于描述和组织数据资源,以便更好地管理和利用这些数据。元数据可以分为不同的类型,包括结构元数据(描述数据的结构和格式)、描述性元数据(描述数据的内容和含义)、管理元数据(描述数据的管理和使用情况)、参考元数据(描述数据的来源和关系)等。
2024-03-29 14:48:28 571 1
原创 Hive 内部表与外部表
内部表(managed table): 未被external修饰的表,也叫管理表。外部表(external table):被external修饰的表。
2024-03-26 16:09:10 853
原创 Hive 数据类型
Hive 中的基本数据类型也称为原始类型,包括整数、小数、文本、布尔、二进制以及时间类型。整数:TINYINT、SMALLINT、INT、BIGINT小数: FLOAT、DOUBLE、DECIMAL文本: STRING、CHAR、VARCHAR布尔:BOOLEAN进制:BINARY时间: DATE、TIMESTAMP、INTERVAL上述数据类型都是对 Java 中的接口的实现,所以类型的具体行为细节和 Java 中对应的类型完全一致。
2024-03-14 19:33:26 989
原创 Hive数据存储模型
Hive中的数据分为真实数据与元数据,一般来说Hive的存储格式是指真实数据的存储格式。Hive常用的存储格式包括以下四种:TEXTFILE,SEQUENCEFILE,RCFILE和ORCFILE。
2024-03-14 18:49:21 907 1
原创 Hive入门
Hive是一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,同时可以将SQL语句转化成MApReduce作业进行运行。
2024-03-12 14:19:23 412
原创 win10环境安装docker及使用docker搭建hadoop、hive 环境
Docker Desktop是适用于Windows的Docker桌面,是Docker设计用于在Windows 10上运行。它是一 个本地 Windows 应用程序,为构建、交付和运行dockerized应用程序提供易于使用的开发环境。Docker Desktop for Windows 使用 Windows 原生 Hyper-V 虚拟化和网络,是在 Windows 上开发 Docker 应用程序的最快、最可靠的方式。
2024-03-01 10:03:37 1156
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人