Hive
AvenueCyy
这个作者很懒,什么都没留下…
展开
-
HiveQL学习笔记(四):Hive窗口函数
本系列是本人对Hive的学习进行一个整理,主要包括以下内容:1.2.3.4.接下来对第四个内容进行介绍。窗口函数1.累计计算窗口函数1.sum(…)over(…)1. partition by:分组的作用2. order by:按照什么顺序进行累加(使用order by 时,数据的范围是一点一点增加的,因此能起到累加的作用)2.avg(…)over(…)移动平均:3.语法总结2.分区排序窗口函数1.row_number()、rank()、dense_rank()ov原创 2020-05-16 11:56:09 · 586 阅读 · 0 评论 -
HiveQL学习笔记(五):Hive练习题
本系列是本人对Hive的学习进行一个整理,主要包括以下内容:1.2.3.4.5.接下来对第五个内容进行介绍。HiveSQL学习笔记(二)对应的练习题这里没有原版的数据,只有字段名,所以只能靠脑补……主要是锻炼思考问题的方法,也可以上网找一些MySQL的题,然后用HiveSQL去完成。以下问题的答案会陆续更新……将user_trade中的时间戳转为以下时间格式2.HiveSQL学习笔记(三)对应的练习题原创 2020-05-16 11:55:50 · 879 阅读 · 0 评论 -
HiveQL学习笔记(三):Hive表连接
本系列是本人对Hive的学习进行一个整理,主要包括以下内容:1.2.3.4.接下来对第三个内容进行介绍。表连接内连接 join例子:注:在写HiveSQL语句时,先对小表进行清洗,可以提升代码的运行速度。两表关联:多表关联:这里第二种写法在数据量较大时,执行的效率最高。外连接 left join例子:没有匹配上的显示为NULL。这里不用 in / not in,利用left join加where效率会高一些。一般用这种来解决该问题。多表关联:全连接原创 2020-05-16 11:55:08 · 860 阅读 · 0 评论 -
HiveQL学习笔记(二):Hive基础语法与常用函数
本系列是本人对Hive的学习进行一个整理,主要包括以下内容:1.2.3.4.接下来对第二个内容进行介绍。Hive是基于Hadoop的数据仓库HiveSQL与传统SQL对比:基础语法1.SELECT…A…FROM…B…WHERE…C…这里放上SQL语法执行的先后顺序:7:SELECT 查询列表 1:FROM 表 2:连接类型 JOIN 表2 3:ON 连接条件 4:WHERE 筛选条件 5:GROUP BY 分组 6:HAVING 分组后原创 2020-05-16 11:54:31 · 775 阅读 · 0 评论 -
HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介
本系列是本人对Hive的学习进行一个整理,主要包括以下内容:1.2.3.4.接下来对第一个内容进行介绍。说明:本系列主要是Hive的使用,其他Hadoop和Hive的原理仅做简单的描述。Hive安装由于Hive在安装前需要安装很多东西,比如虚拟机,Linux系统,Hadoop,MySQL等,这个过程及其繁琐和艰难。由于目的是学习如何使用Hive,而不是搞大数据开发,因此没必要深陷其中。这里推荐厦大林子雨老师的博客,里面已经安装好了全套的大数据软件,只需要自己安装虚拟机,然后导入即可,非常方便原创 2020-05-16 11:53:47 · 791 阅读 · 0 评论