![8d14661215d3deca11f25a04fa5ff06f.png](https://i-blog.csdnimg.cn/blog_migrate/d7e84c4597144d25ac060b5e84f6efd1.jpeg)
时间序列的聚类
在机器学习领域,聚类问题一直是一个非常常见的问题。无论是在传统的机器学习(Machine Learning)领域,还是自然语言处理(Natural Language Processing)领域,都可以用聚类算法做很多的事情。例如在数据分析领域,我们可以把某个物品用特征来描述出来,例如该房子的面积,价格,朝向等内容,然后使用聚类算法来把相似的房子聚集到一起;在自然语言处理领域,通常都会寻找一些相似的新闻或者把相似的文本信息聚集到一起,在这种情况下,可以用 Word2Vec 把自然语言处理成向量特征,然后使用 KMeans 等机器学习算法来作聚类。除此之外,另外一种做法是使用 Jaccard 相似度来计算两个文本内容之间的相似性,然后使用层次聚类(Hierarchical Clustering)的方法来作聚类。
![aaf369da9b0d4c02c46d6c2569c554ff.png](https://i-blog.csdnimg.cn/blog_migrate/23f76c49d752eecbf26d3b597e52dc4b.jpeg)
本文将会从常见的聚类算法出发,然后介绍时间序列聚类的常见算法。
机器学习的聚类算法
KMeans — 基于距离的机器学习聚类算法
KMeans 算法的目的是把欧氏空间