![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
文章平均质量分 60
xiaoxiao______
这个作者很懒,什么都没留下…
展开
-
hive场景题
第一题:了解哪些窗口函数,都是什么功能?找一个在某个业务中的应用? 手写窗口函数及功能意义,同时随便写一个带窗口函数的sql,并说明其sql的含义。over() 既能显示明细信息,也能显示统计信息分析函数用于计算基于组的某种聚合值,但和聚合函数不同的是:对于每个组返回多行,而group by只返回一行,而窗口函数指定了数据分析函数的窗口大小,这个窗口可能会根据行的变化而变化over中还可以加window子句语法:rows between preceding|following|current r原创 2020-11-01 09:41:05 · 987 阅读 · 0 评论 -
hive场景练习题
1、以下数据的每一列分别表示:sid name gender age academy dt chinese math english 95001 李勇 男 20 CS 2017-08-31 56 28 6295002 刘晨 女 19 IS 2017-08-31 84 22 3895003 王敏 女 22 MA 2017-08-31 38 80 8295004 张立 男 19 IS 2017-08-31 39 65 495005 刘刚 男 18 MA 2018-08-31原创 2020-10-16 21:03:15 · 156 阅读 · 2 评论 -
hive的Serde2020-10-15
文章目录Hive的SerDe1 hql读取/动态加载数据的解析2 常用的SerDe类型3.2.1 LazySimpleSerde2.2 CSVSerDe2.3 JsonSerde2.4 RegexSerDeHive的SerDe1 hql读取/动态加载数据的解析--建表语句:create table t2(id int,name string)row format delimitedfields terminated by '\t';--第一个类型:实际上delimited 对应一个原创 2020-10-15 20:46:12 · 156 阅读 · 0 评论 -
hive的函数
第八章 Hive函数在Hive中,函数主要分两大类型,一种是内置函数,一种是用户自定义函数。8.1 Hive内置函数8.1.1 函数查看show functions;desc function functionName;8.1.2 日期函数1)当前系统时间函数:current_date()、current_timestamp()、unix_timestamp()-- 函数1:current_date(); 当前系统日期 格式:"yyyy-MM-dd"-- 函数2:current_原创 2020-10-14 21:54:17 · 331 阅读 · 0 评论 -
hive之分区分桶
第九章 分区表的相关内容9.1 分区简介9.1.1 为什么分区Hive的Select查询时,一般会扫描整个表内容。随着系统运行的时间越来越长,表的数据量越来越大,而hive查询做全表扫描,会消耗很多时间,降低效率。而时候,我们需求的数据只需要扫描表中的一部分数据即可。这样,hive在建表时引入了partition概念。即在建表时,将整个表存储在不同的子目录中,每一个子目录对应一个分区。在查询时,我们就可以指定分区查询,避免了hive做全表扫描,从而提高查询效率。9.1.2 如何分区根据业务需原创 2020-10-14 21:38:32 · 511 阅读 · 0 评论 -
Hive 之复杂数据类型,以及内置函数的应用
复杂数据类型array-- array 类型-- 创表语法 --不指定数组内部分隔符create table if not exists array1(name string,scores array<string>)row format delimited fields terminated by '\t';load data local inpath '/root/hivedata/array1' into table array1;select * from a原创 2020-10-13 21:50:53 · 184 阅读 · 0 评论