k-mean分类器
1.1 题目的主要研究内容
(1)组的主要任务描述
1)k均值算法流程,原理
2)k的选择方法
3)kmeans算法编写
4)鸢尾花实现及结果分析
5)手动推演
6)k均值的改进
(2)自己工作的主要描述
工作内容主要是设计k-mean算法的代码实现,并对例题的手写演算结果进行比对验证。
1.2 题目研究的工作基础或实验条件
(1)硬件环境
pc电脑端
(2)软件环境
使用python语言在pycharm软件上实现算法流程。
1.3 设计思想
K-mean分类器的整体步骤主要分为三个方面。
1)基于聚类中心的样本点分类。主要工作是分别计算每个样本点离聚类中心的距离,并把它添加到对应的类别中。
2)重新计算新的聚类中心。对每类样本的数据求均值并返回。
3)判断是否已经找到最优的聚类中心。对这次的所有样本离聚类中心的总距离和上次做判断,如果不再降低即可认为聚类中心也不在改变,说明我们找到了最优的聚类中心。
基于以上方面,分别构建三个函数实现这些功能。