处理具有业务特性的计算问题:CirroData-TimeS时序数据库用户自定义函数介绍

CirroData-TimeS时序数据库支持用户自定义函数(UDF)以处理业务特定计算问题,提高性能和效率。文章介绍了UDTF和UDAF,重点讲解了UDTF的使用,包括配置、多输入多输出支持,以及创建和注册UDF算子的步骤。通过实例展示了如何检测异常点,并总结了UDF框架在时序处理领域的广泛适用性。
摘要由CSDN通过智能技术生成

CirroData-TimeS时序数据库可以应用于多种场景,例如交通、公共服务、金融、电力、新能源等,针对不同的业务场景,对数据的处理逻辑也会有不同的方式。而通用的时序数据库提供的内置函数一般具有业务通用性,对于具有业务特性的处理逻辑一般情况下都是在业务侧做,会有更多的资源开销。如果数据库能提供更灵活的处理框架能将处理逻辑下推,就可以获得更好的性能。

将用户自己的业务处理逻辑加到数据库的数据处理框架下,会带来两个好处:

  • 处理逻辑复用
  • 计算靠近数据,降低网络资源消耗,提高处理效率


【调研】

大数据处理框架目前使用比较常见的有hive的自定义函数功能,其支持三种自定义函数:

  1. UDF(User Defined Function)用户自定义函数,一进一出
  2. UDAF(User Defined Aggregation Function)用户自定义聚集函数,多进一出;
    类似于: count/max/min/avg
  3. UDTF((User Defined Table-Generating
    Functions)用户自定义表生成函数,一进多出;类似于:explode

在时序数据场景中比较常见的需求是对原始数据进行一些变形、过滤或扩增,并控制数据最终的输出。
本时序数据库当前支持两种用户自定义函数类型:

  1. UDTF(User Defined Timeseries Generating Function),该类函数允许接收多条时间线,最终输出一条时间线,生成的时间线可以有任意多的数据点,本文主要也是介绍此类自定义函数。
  2. UDAF (User Defined Aggregation Function),类似hive的UDAF,一般配合分组查
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值