Hive学习
hive 相关知识
月入两万就收手
头发掉半,工资过万。
展开
-
Hive函数
一.系统内置函数(1)查看系统函数(2)show functions;(3)显示自带函数用法desc functions upper;(4)详细显示自带的函数的用法desc function extended upper;二.函数NVL说明:NVL:给值null的数据赋值,它的格式是nvl(value, default_value). 它的功能是如果value为null时。则返回default_value 的值,否则返回value的值,如果两个参数为null,则返回null。(1)原创 2021-03-30 22:41:12 · 71 阅读 · 0 评论 -
分桶表
一.分桶表的创建create table 表名(id int,name string)clustered by (id) //选择上面字段作为字段into 桶数 bucketsfields terminated by '|'collection items terminated by ','map keys terminated by ':'lines terminated by '\n';//注意分桶时,桶数为偶数二.insert 方式将数据导入分桶表insert into t原创 2021-03-30 18:35:17 · 171 阅读 · 0 评论 -
Hive操作-数据库<查询,修改,删除>
一.查询(1)查看数据库show databases; //查询库(2)过滤显示数据库show databases like ‘条件’ //条件比如说开头字母之类的 ‘a*’(3)显示数据库信息–不长用desc database 库名;(4)显示数据库详细信息–不长用desc database extended 库名;二.修改alter database hive set dbproperties(“修改信息”)–不长用三.删除drop database 表名;//注意:删不了非空原创 2021-03-29 17:42:46 · 437 阅读 · 0 评论 -
表的改名和删表
一.修改表(1)修改表名alter table 原表名 rename to 修改名;二.删除表drop table 表名;原创 2021-03-29 19:26:20 · 1161 阅读 · 0 评论 -
分区表
一.创建分区表create table 表名(id int,name string)partitioned by (day string)row format delimited fields terminated by '\t';load data local inpath '材料一' into table 上面表名 partition(day='分区方式一');load data local inpath '材料二' into table 上面表名 partition(day='分区方式二'原创 2021-03-29 21:53:40 · 68 阅读 · 0 评论 -
创建表 内外部表的区别
一,建表create external table abc(//external 外部的,加了外部表,不加内部表name string,id int,time String,timee string)row format delimitedfields terminated by ‘|’collection items terminated by ‘,’map keys terminated by ‘:’lines terminated by ‘\n’stored as TextF原创 2021-03-29 18:50:37 · 217 阅读 · 0 评论 -
collect_list行转列、concat_ws()--将字段值拼接
一.concat()函数功能:将多个字符串拼接成一个字符串语法: concat(str1,str2,…)返回结果为连接参数产生的字符串 如果有任何一个参数为NULL 则返回值NULLselect concat(name,score) from hehe;select concat(period,’,’,award) as info from collect_ahsyxw;注:-符号 如果参数多的话 需要更多的-符号 因此需要concat_ws()二、concat_ws()函数功能:一原创 2021-09-13 22:59:36 · 2050 阅读 · 0 评论 -
Hive的介绍和特点
Hive的介绍和特点一.什么是Hive二.Hive的优缺点1.Hive的优点2.Hive的缺点一.什么是Hive1.Hive是基于Hadoop一个数据仓库工具,用来数据提取和加载。2.是一个可以存储查询分析在hadoop中大规模数据集的一个机制(机制:协调各个部分之间关系以更好地发挥作用的具体运行方式)3.能够将结构化的数据映射成一张数据库的表,同时提供sql的查询功能,就是将sql转换成MapReduce任务来执行4.因为是转换的MapReduce程序:(1) Hive处理的数据存储在·HDF原创 2021-10-07 23:16:02 · 3621 阅读 · 0 评论