【机器学习】聚类算法笔记

Big Orange...

已于 2022-01-22 16:43:45 修改

阅读量291

点赞数

分类专栏：机器学习文章标签：机器学习

于 2021-12-22 14:15:29 首次发布

本文链接：https://blog.csdn.net/liuzhicheng1845/article/details/122084790

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

链式效应：A与B相似，B与C相似，那么在聚类的时候便会将A、B、C聚合到一起，但是如果A与C不相似，就会造成聚类误差
聚类和分类:聚类无标签是无监督学习，分类有标签是监督学习

一、K-Means算法

K-Means是无监督学习的聚类算法
https://www.cnblogs.com/pinard/p/6164214.html

https://blog.csdn.net/ten_sory/article/details/81016748 (有代码和插图)
我的算法实现：https://editor.csdn.net/md/?articleId=122621063

获取数据 n 个 m 维的数据
随机生成 K 个 m 维的点
while(t)
    for(int i=0;i < n;i++)
        for(int j=0;j < k;j++)
            计算点 i 到类 j 的距离
    for(int i=0;i < k;i++)
        1. 找出所有属于自己这一类的所有数据点
        2. 把自己的坐标修改为这些数据点的中心点坐标
end