mysql 处理cts时间_时序数据库 CTSDB

摘要:在数据流的时间衰减模型中,基础数据集的元素在按时间顺序获得的情况下,越晚获得的元素更重要。 处理大型数据集的常用方法是去维持\ emph {coreset},这是处理数据的简洁摘要,即允许近似恢复预定查询。 我们提供了一个通用框架,它采用任何离线核心集,并为多项式时间衰减函数提供时间衰减核心集。

我们还考虑了k-中值聚类的指数时间衰减模型,其中我们提供了利用在线设施定位算法的常数因子近似算法。 我们的算法存储O(klog(hΔ)+ h)点,其中h是衰减函数的半衰期,Δ是数据集的纵横比。 我们的技术也扩展到k-means聚类和M-estimators。

原文标题:Improved Algorithms for Time Decay Streams

原文摘要:In the time-decay model for data streams, elements of an underlying data set arrive sequentially with the recently arrived elements being more important. A common approach for handling large data sets is to maintain a \emph{coreset}, a succinct summary of the processed data that allows approximate recovery of a predetermined query. We provide a general framework that takes any offline-coreset and gives a time-decay coreset for polynomial time decay functions.

We also consider the exponential time decay model fork-median clustering, where we provide a constant factor approximation algorithm that utilizes the online facility location algorithm. Our algorithm storesO(klog(hΔ)+h)points wherehis the half-life of the decay function andΔis the aspect ratio of the dataset. Our techniques extend tok-means clustering andM-estimators as well.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值