自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Hive——窗口

窗口的定义由窗口子句“[]" 来实现,用于进一步细分分组结果并应用分析函数。窗口子句不支持的函数包括: RANK、NTILE、DENSE RANK、CUME DIST、PERCENT RANK、LEAD及LAG。窗口分为两类:行类型窗口(行窗口)与范围类型窗口(范围窗口)。

2024-06-22 18:23:59 249

原创 Hive 基本操作命令与介绍

Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言HiveQL来对存储在Hadoop集群中的数据进行查询和分析。

2024-03-29 15:01:12 1395 1

原创 Hive 元数据

元数据是描述数据的数据,它提供关于数据的信息,帮助人们理解和管理数据。元数据可以包括各种信息,如数据的来源、格式、结构、含义、关系以及处理方式等。在计算机科学和信息管理领域,元数据通常用于描述和组织数据资源,以便更好地管理和利用这些数据。元数据可以分为不同的类型,包括结构元数据(描述数据的结构和格式)、描述性元数据(描述数据的内容和含义)、管理元数据(描述数据的管理和使用情况)、参考元数据(描述数据的来源和关系)等。

2024-03-29 14:48:28 571 1

原创 Hive 内部表与外部表

内部表(managed table): 未被external修饰的表,也叫管理表。外部表(external table):被external修饰的表。

2024-03-26 16:09:10 853

原创 Hive 数据类型

Hive 中的基本数据类型也称为原始类型,包括整数、小数、文本、布尔、二进制以及时间类型。整数:TINYINT、SMALLINT、INT、BIGINT小数: FLOAT、DOUBLE、DECIMAL文本: STRING、CHAR、VARCHAR布尔:BOOLEAN进制:BINARY时间: DATE、TIMESTAMP、INTERVAL上述数据类型都是对 Java 中的接口的实现,所以类型的具体行为细节和 Java 中对应的类型完全一致。

2024-03-14 19:33:26 989

原创 Hive数据存储模型

Hive中的数据分为真实数据与元数据,一般来说Hive的存储格式是指真实数据的存储格式。Hive常用的存储格式包括以下四种:TEXTFILE,SEQUENCEFILE,RCFILE和ORCFILE。

2024-03-14 18:49:21 907 1

原创 Hive入门

Hive是一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,同时可以将SQL语句转化成MApReduce作业进行运行。

2024-03-12 14:19:23 412

原创 win10环境安装docker及使用docker搭建hadoop、hive 环境

Docker Desktop是适用于Windows的Docker桌面,是Docker设计用于在Windows 10上运行。它是一 个本地 Windows 应用程序,为构建、交付和运行dockerized应用程序提供易于使用的开发环境。Docker Desktop for Windows 使用 Windows 原生 Hyper-V 虚拟化和网络,是在 Windows 上开发 Docker 应用程序的最快、最可靠的方式。

2024-03-01 10:03:37 1156

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除