英文官方教程链接如下:
这又是一个新的开始,关于探究有关无监督学习的数据表征的内容,大家一起加油吧。
Clustering: grouping observations together
我对这个的理解是,既然没有标签,那么我们就将判断出的属于同一类(或者是相似类别)的图像或数据归为同一类,将它们放到一起。我感觉好像是一个又一个部落一样。
下面是作者说的最简单的一种聚簇算法:k-means (不得不说,前辈的最简单对我来说也是个巨大的困难啊),代码如下:
from sklearn import datasets,cluster
import matplotlib.pyplot as plt
wine_x,wine_y = datasets.load_wine(return_X_y=True)
k_means = cluster.KMeans(n_clusters=3)
fit = k_means.fit(wine_x)
labels = k_means.labels_
#这上面的基本上都是一句官网给出的
for index,point in enumerate(labels):
if point == 0:
plt.plot(index,point,'c^')
elif point == 1:
plt.plot(index,point,'b8')
else:
plt.plot(index,point,'mp')
plt.show()
#这是我将聚簇的结果可视化了一下
嘿嘿,我的技术水平不高,大家就凑合看吧。我来解释一下,相同的类放在一起,从图中我们可以看出,横坐标相邻且值一样的,是同一种鸢尾花,而横坐标相邻但是值不一样的那些(穿插其中的),那些要不就不是同一类,要么就是聚簇的结果错了。总的来说效果还是很好的。
后间有一些我没看懂的,大家就自己去学习吧。因为我怕误导你们,抱歉。