HIVE
THE ORDER
卷,学习笔记
展开
-
16 Hive 常用的内置函数
1 概述2 String Functions 字符串函数3 Date Functions 日期函数4 Conditional Functions 条件函数原创 2022-02-13 20:34:25 · 176 阅读 · 0 评论 -
15 Hive 函数概述及分类标准
1 概述2 分类标准原创 2022-02-13 20:28:52 · 65 阅读 · 0 评论 -
14 Hive SQL Join关联查询 语法规则
1 背景2 Hive join语法规则3 inner join 内连接4 left join 左连接语法基本同sql原创 2022-02-13 20:21:29 · 360 阅读 · 0 评论 -
13 Hive SQL DML语法之查询数据
1 Select语法树2 WHERE3 聚合操作4 GROUP BY概念GROUP BY语法限制5 HAVINGHAVING与WHERE区别having是在分组后对数据进行过滤where是在分组前对数据进行过滤having后面可以使用聚合函数where后面不可以使用聚合函数5 ORDER BY6 LIMIT7 执行顺序...原创 2022-02-13 20:12:39 · 101 阅读 · 0 评论 -
12 Hive SQL -DML -Insert插入数据
Hive SQL -DML -Insert插入数据原创 2022-02-13 19:40:21 · 705 阅读 · 0 评论 -
11 Apache Hive DML语句与函数使用
1 Hive SQL DML语法之加载数据原创 2022-02-13 19:33:30 · 141 阅读 · 0 评论 -
10 Hive Show语法
1 常用show语句原创 2022-02-12 21:52:21 · 572 阅读 · 0 评论 -
9 Hive SQL之表与建表
1 建表语法树2 数据类型3 分隔符指定语法4 Hive默认分隔符原创 2022-02-12 21:52:12 · 194 阅读 · 0 评论 -
8 Hive SQL语言:DDL建库、建表
1 Hive数据模型总览2 SQL中DDL语法的作用原创 2022-02-12 21:52:03 · 145 阅读 · 0 评论 -
6 Apache Hive客户端使用
1 Hive自带客户端2 HiveServer2服务介绍原创 2022-02-12 21:52:36 · 317 阅读 · 0 评论 -
5 Apache Hive安装部署
1 什么是元数据元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。2 Hive MetadataHive Metadata即Hive的元数据。 包含用Hive创建的database、table、表的位置、类型、属性,字段顺序类型等元信息。 元数据存储在关系型数据库中。如hive内置的Derby、或者第三方如MySQL等。3 安原创 2022-02-12 21:51:40 · 326 阅读 · 0 评论 -
4 Apache Hive入门
1 Hive简介2 为什么使用Hive3 Hive和Hadoop关系4 映射信息记录5 对Hive的理解6 Apache Hive架构、组件Hive组件7 总结Apache Hive是一款建立在Hadoop之上的开源数据仓库系统,可以将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表,基于表提供了一种类似SQL的查询模型,称为Hive查询语言(HQL),用于访问和分析存储在Hadoop文件中的大型数据集。 Hive核心是将HQL转换为Ma原创 2022-02-12 21:51:29 · 440 阅读 · 0 评论 -
3 数据仓库主流开发语言--SQL
1 数仓开发语言概述2 SQL语言介绍3 结构化数据4 总结主流开发语言SQL列存储优点:单列数据保存在一起,不同列分开存储,导致存下同样一个表需要更多的Block文件,看起来是更复杂了,但是基于列和列分开存储,这种形式天生就适合分布式的存储,并能完全利用并发写入和并发读取的能力同一列存放在一起,数据类型相同,则更好的进行压缩同一列存放在一起,则排序更加方便,基于排序方便,where某一列会更加快行存储优点:更容易实现事务性、一致性控制。关系型数据库基本都是行存储,Mysq原创 2022-02-11 11:11:18 · 1119 阅读 · 0 评论 -
2 数据仓库主要特征
1 数仓主要特征2 面向主题3 集成性4 非易失性、非异变性5 时变性6 总结数仓4大特点1面向主题2集成性3非易失性4时序性原创 2022-02-11 10:42:31 · 397 阅读 · 0 评论 -
1 数据仓库HIVE
1 数仓概念数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。2 数仓专注分析数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统; 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用; 这也是为什么叫“仓库”,而不叫“工厂”的原因3 业务数据的存储问题4 分析型决策的制定5 总结原创 2022-02-11 10:37:59 · 404 阅读 · 0 评论