聚类——寻找规律的第一步
聚类的基本逻辑
聚类的因子和主成分
聚类的步骤
有序聚类与时间序列聚类
**什么是聚类?聚类与分类是一个道理。**分类就是把一个事物拆分成不同的部分,而聚类就是把分散的多个事物归集成不同的类别。
在大数据时代,每个事物都是一个独立的个体,并且我们有着描述这个个体各种各样的数据,因为个体太多了,所以开始看不清楚这些事物是什么了。因此需要把这些事物进行归集、整理,这样可以便于管理。面对上千个有个性化要求的客户,该如何满足他们呢?这就需要我们把几千个需求进行归类,然后分类满足,这样就比较容易实现。
分类与聚类的逻辑相反,但结果一样。分类是我们看到了上千个事物,但不知道怎么认识它们,也不能把它们都当作一个事物看待,所以需要把这些事物拆分成几大类,分类管理。所以,分类和聚类的本质是一样的,都是得到一个最终的能够进行分类管理事物的方法,只是出发点不同:分类从整体出发,聚类从每个事物的具体细节出发。
聚类和分类都是人类认知事物的基本思路之一,在找寻事物发展规律的旅途上,分类是必不可少的基础,没有对事物的分类,所有的规律都不可能得到应用。找到一类事物的规律,通过对类别的识别,从而推演出该类中的其他事物也可以使用这个规律,这样的规律才是真正的规律。任何只适合个案的规律都不能称作规律,规律本身必须具有普适性,这个普适性是指在一“类”事物上是普遍适用的。所以,把