- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 R----kmeans
K-means 算法是很经典的基于距离的无监督硬聚类算法。算法认为对象距离近的, 其相似度越大。算法最终会得到一个,簇内距离尽量小,不同簇间距离尽量大的一个分类结果。1.对样本进行初始聚类(离哪个近就归到那类)。 2.然后计算每个簇中的中心值。在对样本重新聚类(离哪个近就归到那类)。一直迭代重复,直到两次得到的中心值相同或达到设定的阈值,迭代结束。此时的聚类结 果为最终的聚类结果。 ...
2017-08-28 17:06:45 315
原创 R————KNN
KNN(最近邻分类) 它是数据挖掘算法中 可以说是最简单的一种算法了,所谓近邻,乃是以K个最近的邻居代表某个样本。KNN算法的核心思想是,样本在特征空间中的K个邻居大多属于一个类别,则该样本也属于该类别,并具有该类别的样本特性。KNN算法在分类决策中只依据样本的一个或多个邻近值来决定待测样本的类别。由于KNN算法的分类决策只和极少量的样本有关,它不同于靠区间域分类。所以在处理 区间域交叉重叠较多
2017-08-27 15:43:30 592
数据分析思维实战——竞品分析
2020-06-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人