什么是聚类,什么是分类。
啥时候聚类,啥时候分类。
对初学者来说,这两个意思差不多的词都能纠结很久。
分类就是把数据按类别分开,比如人分成男女,身高分成高矮,体重分成胖瘦。
这里,我们已经明确的群体,如这些人是男的,这些人是女的,我们通过对已知数据的学习,完成对测试数据的分类。
聚类就不同了。
我期望把这群人分成男女,但是我对男女性别的特征一无所知,数据里可能有身高,体重,选购的商品,通过对这些数据的学习将所有数据划分开来。
我猜至少可以划分成三类,比较确定的男性,比较确定的女性,无法推知性别的一组。
如果对机器学习有所了解了,你会很自然的发现,分类属于监督学习,聚类是无监督学习。
以上,是这周的一个小思考总结。
有问题还请留言指正,共同探讨~