hive
文章平均质量分 76
hive机构及使用,hive语法及进阶
小洲C
这个作者很懒,什么都没留下…
展开
-
Hive求连续登录问题
学生表中按班级求年龄前三dense_rank:有并列排名,依次递增 (开窗函数相当于Top-N)select * from ( select *,dense_rank() over(partition by clazz order by age)as num from students) as t where t.num<=3;#### 连续登陆问题> 在电商、物流和银行可能经常会遇到这样的需求:统计用户连续交易的总额、连续登陆天数、连续登陆开始和结束时间、间...原创 2021-11-28 21:19:57 · 639 阅读 · 0 评论 -
Hive数据仓库建模
1、基于Hive数据仓库建模数据仓库的发展大致经历了这样的三个过程:报表——>集市——>仓库简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个阶段的大部分表现形式为数据库和前端报表工具。数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。数据仓库阶段:这个阶原创 2021-11-28 17:14:04 · 3136 阅读 · 0 评论 -
Hive语法及进阶
1、Hive基本操作——建表内部表基础建表语句一:(默认指定文件类型为TextFile,HDFS路径为/user/hive/warehouse/库/下) 格式: create table 表名 ( 字段名1 字段类型1, 字段名2 字段类型2, ... ) row format delimi...原创 2021-11-27 20:41:43 · 1117 阅读 · 0 评论 -
Hive架构及使用
1、Hive是什么?Hive 是建立在 Hadoop 上的数据仓库(Data Warehouse)基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL ,它允许熟悉 SQL 的用户查询数据。Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。Hive的表其实就是HDFS的目录,按表名把文件夹分开。如果是分区表...原创 2021-11-24 09:43:02 · 597 阅读 · 0 评论