Hive
文章平均质量分 84
bigdata-rookie
随便写点
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive 简介
Hive 一个基于 Hadoop 的数据仓库,适用于一些高延迟性的应用(离线开发),可以将存储在 Hadoop 文件中的结构化、半结构化数据文件映射为一张数据库表,并基于表提供类似 SQL 的查询模型,称为 Hive 查询语言(HQL),用于访问和分析存储在 Hadoop 文件中的大型数据集。Hive 的核心是将 HQL 转换为 MapReduce 程序,然后将程序提交到 Hadoop 集群执行;Hive 本身不存储和计算数据,它完全依赖于 HDFS 和 MapReduce,Hive 中的表是纯逻辑表。原创 2025-11-13 21:44:49 · 562 阅读 · 0 评论 -
Hive 函数
UDF(User-Defined-Function) 普通函数,一进一出;例如:round 这样的函数;UDAF(User-Defined Aggregation Function)聚合函数,多进一出;例如:count、sum 这样的函数;UDTF(User-Defined Table-Generating Function)表生成函数,一进多出;例如:explode 函数。原创 2024-07-16 17:26:04 · 1403 阅读 · 1 评论 -
Hive-3.1.2 远程模式部署
前置条件需要安装好了jdk环境、mysql、以及全分布的Hadoop集群一、安装将安装包解压到 /opt 目录下tar -zxf apache-hive-3.0.0-bin.tar.gz -C /opt配置环境变量vi /etc/profileexport HIVE_HOME=/opt/hive-3.0.0-binexport PATH=${HIVE_HOME}/bin:$PATH 使用mysql存储hive元数据## 创建hive数据库create database hive;原创 2021-11-03 17:16:45 · 1701 阅读 · 0 评论
分享