tslearn使用轮廓系数（silhouette_score）评估KShape聚类效果

最新推荐文章于 2024-08-17 09:01:26 发布

青春依旧_

最新推荐文章于 2024-08-17 09:01:26 发布

阅读量1.8w

点赞数 48

分类专栏：时序聚类 python 文章标签：轮廓系数 tslearn KShape 聚类 silhouette

本文链接：https://blog.csdn.net/qq_37960007/article/details/107937212

版权

前言

tslearn和sklearn一样，是一款优秀的机器学习框架，tslearn更偏向于处理时间序列问题，如其聚类模块就包含了DTW（Dynamic Time Warping）等算法及变种，也提供了轮廓系数对聚类效果评估，十分方便。但可惜，tslearn似乎没有提供对KShape聚类的评估方法，而且tslearn用的人也不多，官方文档也是很 “简洁”，网上也搜不到多少相关文章，所以这里也就记录下自己的踩坑过程

轮廓系数评估接口调用

先看官方例子，这里X是一个三维的numpy数组，代表20段时间序列，每段序列16个时间点。labels代表每段时间序列（每条时间曲线）的聚类结果，metric是每条时间曲线之间相似度度量方法，可以看到官方提供了dtw-dba、softdtw以及欧氏距离三种相似度度量方法，但没有关于KShape聚类的。

注意到最后一行，metric=“precomputed”，说明官方提供了用户自定义的距离度量方法，很好，那么使用silhouette_score评估KShape的关键就在此了。又注意到precomputed的时候，参数传的是cdist_dtw(X)，而其他传的是X，有什么区别？

打印