hiveSQL常见函数及用法(持续收集)

1,时间函数

在这里插入图片描述

2,聚合函数

注意:聚合函数常与 SELECT 语句的 GROUP BY 子句一块儿使用。换句话说使用聚合函数时,一个列字段要不在group by里,要没必要须在聚合函数里面,不能单独出现,不然报错。
在这里插入图片描述

3,字符串函数

在这里插入图片描述

4,连接函数

在这里插入图片描述

5,其他函数

在这里插入图片描述

6,窗口函数

1,lead(col,n,m) over(partition by … order by …):
其中col是要取的字段,n是取排序后的第几条记录;m是缺省值,如果后面的记录取不到值就去m,m的数据类型要和col一致,不然会报错,m可不填值,默认为空

2,lag() over(partition by … order by …)
与lead() over(partition by … order by …)相似,只是去上一条记录的某字段;

3,ROW_NUMBER()
为每一组的行按顺序生成一个连续序号。

4,RANK()
也为每一组的行生成一个序号,与ROW_NUMBER()不同的是如果按照ORDER BY的排序,如果有相同的值会生成相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号2,那么接下来会生成序号4

5,DENSE_RANK()
和RANK()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同的行生成序号2,那么接下来生成的序号还是3。

注意:3,4,5都属于排名开窗函数,ORDER BY 指定排名开窗函数的顺序,在排名开窗函数中必须使用ORDER BY语句。

6,Hive-sql特点和sql的区别

1、Hive不支持等值连接

不支持等值连接,一般使用left join、right join 或者inner join替代。

SQL中内关联可以这样写: select * from a , b where a.key = b.key
Hive中应该这样写: select * from a join b on a.key = b.key
hive中不能使用省去join的写法。
2、分号字符

分号是sql语句的结束符号,在hive中也是,但是hive对分号的识别没有那么智能,有时需要进行转义 “;” --> “\073”

3、NULL

sql中null代表空值,但是在Hive中,String类型的字段若是空(empty)字符串,即长度为0,那么对它 is null 判断结果为False

4、Hive不支持将数据插入现有的表或分区中

Hive仅支持覆盖重写整个表。
insert overwrite 表 (重写覆盖)

5、Hive不支持 Insert into 表 Values(), UPDATA , DELETE 操作

insert into 就是往表或者分区中追加数据。

6、Hive支持嵌入mapreduce程序,来处理复杂的逻辑
7、Hive支持将转换后的数据直接写入不同的表,还能写入分区,hdfs和本地目录

避免多次扫描输入表的开销。

8、HQL不支持行级别的增、改、删,所有数据在加载时就已经确定,不可更改。
9,HiveSQL不支持事务,支持分区存储,HiveSQL落地到hdfs

收藏加关注,再来不迷路!!!

### HiveSQL 中替换字符串的函数HiveSQL中,存在多种用于处理字符串替换的功能。主要使用的两个函数分别是`regexp_replace`和`translate`。 #### `regexp_replace` 此函数允许通过正则表达式模式匹配来执行更复杂的字符替换操作。语法如下: ```sql regexp_replace(string initial_string, string pattern, string replacement) ``` 该函数会返回一个新的字符串,在这个新字符串里所有的符合给定正则表达式的子串都会被替换成指定的新字符串[^1]。 例如,如果想要把所有大写字母"A"替换成小写字母"a": ```sql SELECT regexp_replace('AaBbCcDdEe', 'A', 'a') AS replaced; -- 结果: aaBbCcDdEe ``` #### `translate` 不同于基于正则表达式的`regexp_replace`,`translate`提供了一种简单的方式来进行一对一字符映射转换。其基本形式为: ```sql translate(string src_str, string from_str, string to_str) ``` 这里`from_str`中的每一个字符会被相应位置上的`to_str`里的字符所取代;若`to_str`长度小于`from_str`,超出部分将被删除[^2]。 比如要将字符串内的某些特定符号互换: ```sql SELECT translate('hello world!', '!worl', 'WORLD') AS translated; -- 结果: hello WORLD! ``` 这两个函数都属于Hive内置的标准字符串处理工具集的一部分,对于日常的数据清洗工作非常有用。为了获取更多关于这些以及其他常用函数的信息,可以利用`desc function extended`命令查看详细的帮助文档[^3]。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值