K - Classify
K 分类是个什么玩意儿?
很简单,K分类用四个字来概括就是物以类聚,如果要再加四个字的话就是人以群分。
K 分类的过程
导入训练样本集合(这个必须有)。每个样本拥有一个或多个已经确定好的特征并且存在一个确定的标签(Label)。
- K-Classify算法通过完成对训练样本根据标签进行分类的过程建立一个多维坐标系(先这么理解),坐标系的维度就是样本的特征数目。样本集合中的每一个数据都会抽象为坐标系上的一个点。
导入测试样本集合(KNN已经开始啦~~),将样本集合中的每一个数据继续抽象(想象)为多维坐标系中的一个点。
- 对样本集合中的每一个数据,计算其与训练样本中全部数据的距离。此处使用了我们初中时学过的坐标系中两点间的距离公式:
d=(x0−y0)2+(x