HIVE常用UDF

最新推荐文章于 2022-12-03 20:29:00 发布

caoxx2323

最新推荐文章于 2022-12-03 20:29:00 发布

阅读量4.1k

点赞数

文章标签： hive

本文链接：https://blog.csdn.net/caoxx2323/article/details/107031429

版权

这篇文章用来记录自己用过的hiveUDF和使用方法，将来也会陆续一直更新。

数据格式

get_json_object(）

遇到以json形式储存的数据时可以用get_json_object() 来获取json中某一个值

具体示例： get_json_object(value,’$.id’)

collect_set()

collect_set() 可以用来形成不包含duplicates的array，如果要包含duplicates的话用collect_list()

具体示例： collect_set(id)

concat_ws()

concat_ws() 可以把array或者多个string整合成用指定delimiter的一条string

具体示例： concat_ws(array)
进阶用法：可以与collect_set() 结合使用
- 计算累计的distinct id： concat_ws(’,’,collect_set(t_id)) as id_set

explode()

explode() 可以把一个array或者map转换成多行的一列数据

进阶用法：与上文的concat_ws(), collect_set() 结合使用
- 计算累计的uv： LATERAL VIEW explode(split(id_set,","))

时间相关

add_month()

add_month() 可以增减月份，计算一年数据时可以直接算到去年同天数，不用考虑一年有多少天

具体示例： add_month(current_date(),-12)

unix_timestamp(）

unix_timestamp(）可以根据给定pattern转化时间数据的格式

具体示例： unix_timestamp(current_date(), ‘yyyyMMdd’)

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

caoxx2323

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

hive常用的函数和udf开发

qq_43227570的博客

05-14

710

hive的udf开发继承udf这个类，方法重载evaluate 1. add jar /opt/udftest.jar 2. create temporary function 功能名as “主类路径”; 使用python脚本transform开发： 1. add FILE weekday_mapper.py; 2. SELECT TRANSFORM (要转化的字段)USIN ‘python...

hive自定义udf函数实战

qq_34936033的博客

02-17

1370

参与评论您还未登录，请先登录后发表或查看评论

hive常用UDF and UDTF函数介绍-lateral view explode()

热门推荐

zeb_perfect的专栏

11-23

1万+

前言： Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。这里只大概说下Hive常用到的UDF函数，全面详细介绍推荐官网wiki：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF。定义： UDF(User-Defined-Function)，用户自定义函数对数据进行处理。

hive udf、udaf、udtf使用区分

唤不醒的梦

09-28

5142

UDF：一进一出实现方法：1. 继承UDF类 2. 重写evaluate方法 3. 将该java文件编译成jar 4. 在终端输入如下命令： hive> add jar test.jar; hive> create temporary function function_name as 'com.hrj.hive.udf.UDFClass'; hive> s

hive的UDF函数的使用。常见UDF函数

东城庞太师

05-26

4142

UDF的话一般是hive提供的函数功能满足不了业务需要，我们就会自己来写UDF函数来辅助完成，对于我们常用的函数而言还是哪些常见的聚合函数，如：count、sum、avg、max、min等，其他的话就要切合我们的需求来进行使用了，不过一般较为常用的有 1.cast(expr as <type>) 可以做： cast('1' as BIGINT) 字符串转换为数字 2、if语句 if(boolean testCondition, T valueTrue, T valueFalseOrN.

hive-udf

幻神舞的专栏

08-12

814

hive udf相关技术信息、代码实现、实际操作。

hive-udf-example

06-08

Java是Hive UDF开发的常用语言，因为Hive是用Java实现的，并且与Java生态系统兼容良好。编写UDF涉及创建Java类，继承Hive提供的基础类，如`org.apache.hadoop.hive.ql.exec.UDF`，并实现相应的方法。在“hive-udf-...

HIVE 函数分类（udf、udaf、udtf）

xby18772963985的博客

12-07

564

注释：在Hive中，用户可以自定义一些函数，用于扩展HiveQL的功能，而这类函数叫做UDF（用户自定义函数）。 UDF分为两大类：UDAF（用户自定义聚合函数）和UDTF（用户自定义表生成函数）。 Hive内置函数实际上Hive内置了很多函数，包括关系/算数/逻辑操作符都属于函数 hive提供的build-in函数包括以下几类：关系操作符：包括 = 、 <> 、 <= 、>=等算数操作符：包括 + 、 - 、 *、／等逻辑操作符：包括AND 、 &&

hive自定义函数udf（临时和永久函数）

zll_1234的博客

05-28

1957

hive自定义函数udf和udtf 一、UDF（user defined functions）用于处理单行数据，并生成单个数据行 1、自定义UDF 的步骤： 1.1、编写自定义的UDF函数继承"org.apache.hadoop.hive.ql.exec.UDF"类至少实现一个evaluate()方法，evaluate函数支持重载例子： import org.apache.hadoop.hive.ql.exec.UDF; import java.text.ParseException; import

Hive 函数UDF开发以及永久注册UDF函数

烙痕丷的博客

07-14

8152

explode：（把一串数据转换成多行的数据）创建一个文本：[hadoop@ruozehadoop000 data]$ vi hive-wc.txthello,world,welcomehello,welcome创建一个表，并导入文本内容create table hive_wc(sentence string); load data local inpath '/home/hadoop/data...

hive UDF需要jar包

12-09

hive编写 udf 至少需要引入的jar包：hive-exec-xxx.jar 和 hadoop-core-xxx.jar

hive UDF

yanglq的博客

04-24

471

https://www.cnblogs.com/hd-zg/p/5947468.html

Hive自定义UDF函数--常用的工具类

王凯凯之猿的博客

05-21

2487

注册函数：将自定义函数打成jar包，上传hdfs$hive>create function formattime as 'com.air.udf.FormatTimeUDF' using jar 'hdfs://mycluster/user/centos/air-hive-1.0-SNAPSHOT.jar'自定义函数：1，将long型的时间片格式化成指定日期格式import org.apac...

67-94-hive-函数-开窗函数-常用函数-udf自定义函数

最新发布

qq_37171694的博客

12-03

404

hive-67-94

HIVE UDF整理

Dzhantao的博客

07-03

1435

<article> <div id="article_content" class="article_content clearfix csdn-tracking-statistics" data-pid="blog" data-mod="popu_307" data-dsm="post"> &

Hive的UDF函数简单示例开发

fa124607857的博客

11-09

1145

Hive函数 1.1、内置函数内容较多，见《Hive官方文档》 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 1）查看系统自带的函数 hive>show functions; 2）显示自带的函数的用法 hive>desc function upper; 3）详细显示自带的...

Hive中的UDF、UDAF和UDTF简单使用和应用场景

浪子城

12-01

2031

UDF User-Defined-Function 自定义函数、一进一出；背景系统内置函数无法解决实际的业务问题，需要开发者自己编写函数实现自身的业务实现诉求。应用场景非常多，面临的业务不同导致个性化实现很多，故udf很需要。意义函数扩展得到解决，极大丰富了可定制化的业务需求。 IO要求-要解决的问题 in:out=1:1,只能输入一条记录当中的数据，同时返回一条处...

Hive的UDF、UDAF、UDTF

Amazingjadewu

05-20

2279

本篇文章详细讲解UDF、UDAF、UDTF的使用及注意事项，下章将会讲解在UDF的基础之上使用Hive 2.1中transform接口。 Hive进行UDF开发十分简单，此处所说UDF为Temporary的function，所以需要hive版本在0.4.0以上才可以。一、背景：Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用

UDF函数在Hive中的使用

liweihope的博客

05-02

2163

UDF介绍官网： https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF UDF: User-Defined Function用户自定义函数。在Hive中，有很多的内置函数，它自带的，但是呢，就算有很多内置函数，它也满足不了众多业务逻辑的需求。所以呢，在工作中我们还是需要去自己开发UDF函数来实现我们想要的功能。...