今天手写实现了k-means,目的是加深对这个算法原理的理解,有不足的地方请多指教。
ris鸢尾花数据集包含3个不同品种的鸢尾花(Setosa,Versicolour,and Virginica)数据,花瓣和萼片长度,存储在一个150*4的 numpy.ndarry中
150行4列,150行指150多花,4列分别是Sepal Length,Sepal Width, Petal Length and Petal Width
使用pandas官方demo
本代码使用k-means实现对莺尾花种类class的区分,最后进行了可视化
导入库