问题:对于给定的数据集{x1,x2...xn},如何根据样本点自身的数据特性实现分类,也就是在没有标签的情况下将距离较近的数据点划分到同一类,假设这个类别就是他们的标签。也就是解决如下问题:
通过计算机来将人类可以迅速分类的点群划分出来。
这里介绍几个常用的求点到中心距离公式:
1)Minkowski Distance 公式 —— λ 可以随意取值,可以是负数,也可以是正数,或是无穷大。
2)Euclidean Distance 公式 —— 也就是第一个公式 λ=2 的情况
3)CityBlock Distance 公式 —— 也就是第一个公式 λ=1 的情况