序列挖掘 --- >BOSS

该博客介绍了BOSS方法在序列挖掘中的应用,它通过提取时间序列的子结构,进行低通滤波和量子化降噪,然后利用字符串匹配算法比较两个序列的差异。BOSS方法速度快,能有效降噪,并具有对偏移不变性的参数调整能力。其主要步骤包括固定长度滑动窗口、Z归一化、SFA符号傅里叶近似和量子化。通过DFT进行低通滤波和MCB量子化,最终计算BOSS距离来衡量序列间的相似性。
摘要由CSDN通过智能技术生成

Boss

bag-of-SFA-symbols

它首先从时间序列中提取子结构(substructures)
对子结构应用低通滤波和量子化,这能够降低噪声,并使用字符串匹配算法
然后比较两个时间序列noise-reduced patterns的差别
在这里插入图片描述
优点:

应用了降噪(noise reduction)
invariance to offsets is treated as a parameter
结构基的相似性

和dtw一样快,并且比dtw更准确。

具体过程:
对时间序列 一固定长度的滑动窗口。
每个窗口通过减去均值和方差,进行z-normalized

从值到字符

进行 SFA (symbolic fourier approximation)
作用:
低通滤波 (low pass filtering)
字符表示(string representation) 使用量子化来表示 (quantisation)

  • 分为两步

    • 近似(approximation )使用 DFT discrete fourier transform来近似
    • 量子化(quantisation) 使用MCB multiple coefficient binning
  • DFT
    分解一个长度为n的信号T,成为一系列正交项基函数,每一个基能够被表示为
    X u = ( r e a l u , i m a g u ) f o r u = 0 , 1 , . . . , n − 1 X_u=(real_u, imag_u) for u=0,1,...,n-1 Xu=(realu,imagu)foru=0,1,...,n1,成为傅里叶系数
    D F T ( T ) = X 0 . .

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值