数据分析进阶-基于tslearn的单变量时间序列聚类

前言

最近受一篇2015年文章《时间序列用户生命周期的聚类方法》的启发,阅读了很多时间序列聚类相关的方法,用消费行为的时间序列尝试去对用户行为进行分群,虽然现阶段的效果不如预期,就当总结希望后续能有所交流~

基于日消费总额的时间序列聚类

为了更好地保留用户消费行为时间序列特征(包含全局特征&局部特征),采用基于时间序列形状的方式以计算序列相似度进行用户行为区分,其中尝试了两个方向:

一、方法说明
1.DTW

DTW即Dynamic Time Warping,是动态时间规整算法,利用DTW的原因是用户在不同时间点上消费行为存在不一致性,为保证存在相似序列的用户能有效地归类
在这里插入图片描述

2.KShape

KShape 是一种时间序列聚类算法,由论文《k-Shape: Efficient and Accurate Clustering of Time Series》提出,该算法的核心是迭代增强过程,可以生成同质且较好分离的聚类。该算法采用标准的互相关距离衡量方法,基于此距离衡量方法的特性,提出了一个计算簇心的方法,在每一次迭代中都用它来更新时间序列的聚类分配

二、实验说明

实验利用日消费总额时间序列(如图),基于tslearn工具包(具体用法可见其官方文档:https://tslearn.readthedocs.io/en/stable/)完成聚类实验
在这里插入图片描述

1.输入数据

源数据的格式如下:user, date1, date2, date3, …, daten,可利用tslearn的to_time_series_dataset方法对数据进行处理

import pandas as pd
import numpy as np
from tslearn.utils import to_time_series_dataset

data = pd.read_csv('data.csv')
input_data = to_time_series_dataset
  • 0
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 11
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值