Hadoop
文章平均质量分 81
weixin_41469311
目前在苏州面向云原生方面的工作
展开
-
初始Hive
初步认识HiveHive是构建在hadoop之上的数据仓库。不是用来增删改查的那种数据库,那是数据库。 1)数据计算是MapReduce 2)数据存储是HDFS 认识 Hive Hive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据, 可以将结构化的数据文件映射为一张数据库表,并提供完整的...转载 2018-02-13 15:01:39 · 206 阅读 · 0 评论 -
Hive 文件格式 & Hive操作(外部表、内部表、区、桶、视图、索引、join用法、内置操作符与函数、复合类型、用户自定义函数UDF、查询优化和权限控制)
本博文的主要内容如下: Hive文件存储格式 Hive 操作之表操作:创建外、内部表 Hive操作之表操作:表查询 Hive操作之表操作:数据加载 Hive操作之表操作:插入单表、插入多表 Hive语法结构:where 查询、all 和 distinct 选项、基于 Partition 的查询、基于 HAVING 的查询、 LIMIT 限制查询、 GROUP BY 分组查询、 ORDE...转载 2018-02-13 15:05:35 · 1252 阅读 · 0 评论 -
Hive中Join的类型和用法
关键字:Hive Join、Hive LEFT|RIGTH|FULL OUTER JOIN、Hive LEFT SEMI JOIN、Hive Cross JoinHive中除了支持和传统数据库中一样的内关联、左关联、右关联、全关联,还支持LEFT SEMI JOIN和CROSS JOIN,但这两种JOIN类型也可以用前面的代替。注意:Hive中Join的关联键必须在ON ()中指定,不能在Wher...转载 2018-02-13 15:06:35 · 397 阅读 · 0 评论 -
Hive复杂数据类型
1、Array数据类型的使用1.1、创建数据库表,以array作为数据类型1234hive (hive_demo1)> create table stu_test(name array<string>,phone array<string>) > row format delimited fields terminated by...原创 2018-02-13 15:07:36 · 210 阅读 · 0 评论