处理具有业务特性的计算问题：CirroData-TimeS时序数据库用户自定义函数介绍

最新推荐文章于 2023-02-03 21:24:22 发布

CirroData

最新推荐文章于 2023-02-03 21:24:22 发布

阅读量395

点赞数

文章标签：时序数据库 hive big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CirroData/article/details/124938282

版权

CirroData-TimeS时序数据库支持用户自定义函数（UDF）以处理业务特定计算问题，提高性能和效率。文章介绍了UDTF和UDAF，重点讲解了UDTF的使用，包括配置、多输入多输出支持，以及创建和注册UDF算子的步骤。通过实例展示了如何检测异常点，并总结了UDF框架在时序处理领域的广泛适用性。

摘要由CSDN通过智能技术生成

CirroData-TimeS时序数据库可以应用于多种场景，例如交通、公共服务、金融、电力、新能源等，针对不同的业务场景，对数据的处理逻辑也会有不同的方式。而通用的时序数据库提供的内置函数一般具有业务通用性，对于具有业务特性的处理逻辑一般情况下都是在业务侧做，会有更多的资源开销。如果数据库能提供更灵活的处理框架能将处理逻辑下推，就可以获得更好的性能。

将用户自己的业务处理逻辑加到数据库的数据处理框架下，会带来两个好处:

处理逻辑复用
计算靠近数据，降低网络资源消耗，提高处理效率

【调研】

大数据处理框架目前使用比较常见的有hive的自定义函数功能，其支持三种自定义函数:

UDF(User Defined Function)用户自定义函数，一进一出
UDAF(User Defined Aggregation Function)用户自定义聚集函数，多进一出;
类似于: count/max/min/avg
UDTF((User Defined Table-Generating
Functions)用户自定义表生成函数，一进多出;类似于:explode

在时序数据场景中比较常见的需求是对原始数据进行一些变形、过滤或扩增，并控制数据最终的输出。
本时序数据库当前支持两种用户自定义函数类型:

UDTF(User Defined Timeseries Generating Function)，该类函数允许接收多条时间线，最终输出一条时间线，生成的时间线可以有任意多的数据点，本文主要也是介绍此类自定义函数。
UDAF (User Defined Aggregation Function)，类似hive的UDAF，一般配合分组查

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。