![](https://img-blog.csdnimg.cn/2020112822382548.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
hive
文章平均质量分 95
hive学习记录
缦旋律
沉迷磕CP并努力敲代码的小陈
展开
-
SQL\HIVE 零碎知识点学习
1.union、union all、intersectunion:并集(去重)union all:所有的记录都拼接起来,不去重intersect:交集2. hive 3rd function2.1 array functionfunctiondescriptionarray_contains(array<E>, E) -> booleanwhether array contains value or not.array_equals(array&l原创 2021-01-11 18:06:16 · 1000 阅读 · 0 评论 -
hive:电影数据实战
70w+条数据,8个具体实例原创 2020-12-08 14:18:14 · 1985 阅读 · 1 评论 -
hive:日期相关函数
current_date() 返回当前日期date_add,date_sub日期的加减 e.g.date_add(current_date(),90)今天往后90天的日期,date_sub(current_date(),90)今天往前90天的日期。datediff()计算两个日期之间相差的天数 e.g. datediff(‘1997-08-05’,‘1991-10-05’)例题:请用business数据,查看哪些顾客连续两天有购买行为原始数据如下:变量分别为name、orderdate、co.原创 2020-12-07 15:27:31 · 311 阅读 · 0 评论 -
hive:窗口函数(开窗函数)over
hive窗口函数(开窗函数)over的使用介绍+实例讲解原创 2020-12-07 11:15:41 · 1459 阅读 · 0 评论 -
hive:常用函数(case when,collect_list/set,lateral view explode)
case when;collect_list/set(行转列);explode(列转行)原创 2020-12-06 20:10:39 · 1097 阅读 · 0 评论 -
hive:排序查询
hive排序查询中所涉及到的order by 、sort by 、distribute by和cluster by原创 2020-12-06 16:13:28 · 227 阅读 · 0 评论 -
hive:like和rlike
hive中like和rlike的用法原创 2020-12-06 15:55:24 · 551 阅读 · 0 评论 -
hive:导出数据
文章目录一.insert 导出1.将查询结果导出到本地2.将查询结果格式化导出到本地3.将查询结果导出到hdfs中二.hadoop命令导出到本地一.insert 导出1.将查询结果导出到本地insert overwrite local directory '/opt/module/datas/export/dept1'select * from dept_part2;2.将查询结果格式化导出到本地insert overwrite local directory '/opt/module/da原创 2020-12-06 15:06:55 · 198 阅读 · 0 评论 -
hive:分区表和分桶表以及二者区别
文章目录一.分区表(partitioned by)1.创建分区表2.插入数据3.查询分区表中的数据4.增加/删除分区5.二级分区表6.空区填补数据二.分桶表(clustered by)三.分区表和分桶表的区别一.分区表(partitioned by)1.创建分区表--创建分区表create table dept_part(deptno int,dname string,loc string)partitioned by (month string)row format delimited fi原创 2020-12-06 11:53:02 · 2782 阅读 · 0 评论 -
hive:外部表与内部表
首先建立一个外部表,放在hdfs的根目录下create external table stu_external(id int, name string) row format delimited fields terminated by '\t' location '/student';向表中插入数据:load data local inpath '/opt/module/datas/student.txt' into table stu_external;从下图可以看出,hdfs的原创 2020-12-05 20:32:36 · 303 阅读 · 0 评论 -
hive:DDL
1.库1.1创建数据库语法:CREATE DATABASE [IF NOT EXISTS] database_name[COMMENT database_comment][LOCATION hdfs_path][WITH DBPROPERTIES (property_name=property_value, ...)];PS:数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db(即如果location那儿不指定具体路径,那么创建的database就放在ware原创 2020-11-28 22:35:23 · 136 阅读 · 0 评论