Hive
Demo_chen
这个作者很懒,什么都没留下…
展开
-
数据仓库构建拉链表之 Hive 操作
1. 什么是拉链表 拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效开始日期。 如果当前信息至今有效,在生效结束日期中填入一个极大值(如9999-99-99 ) 2.为什么要做拉链表 拉链表适合于:数据会发生变化,但是大部分是不变的。 比如:订...原创 2019-05-09 16:01:10 · 856 阅读 · 0 评论 -
大数据技术 HiveSQL 中的开窗函数 (窗口函数)
HiveSQL 窗口函数(开窗函数)1.相关函数说明OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。CURRENT ROW:当前行n PRECEDING:往前n行数据n FOLLOWING:往后n行数据UNBOUNDED:起点,UNBOUNDED PRECEDING 表示从前面的起点, UNBOUNDED FOLLOWING表示到...原创 2019-05-22 21:29:19 · 1267 阅读 · 0 评论 -
大数据技术 Hive 的 安装与配置
1.Hive安装及配置(1)把apache-hive-1.2.1-bin.tar.gz上传到linux的/opt/software目录下(2)解压apache-hive-1.2.1-bin.tar.gz到/opt/module/目录下面[test@hadoop102 software]$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt/mod...原创 2019-05-20 19:50:19 · 416 阅读 · 0 评论 -
大数据技术 Hive 的 介绍
什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序1)Hive处理的数据存储在HDFS2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上Hive架...原创 2019-05-20 19:26:43 · 158 阅读 · 0 评论