来自清风的数学建模课程,主要是用于自己复习看,所以截图较多
聚类和分类的区别:分类已知类别 聚类未知
K-means算法
评价该算法
优点
- 算法简单、快速
- 对处理大数据集,该算法相对效率高
缺点
- 要求用户事先选定蔟的数目K
- 对初值敏感
- 对于孤立点数据敏感
K-means++算法可以处理上述的缺点2 3
K-means++算法
基本原则:初始的聚类中心之间的相互距离要尽可能的远
系统(层次)聚类
绝对值距离:使用网状距离
类与类之间的距离
操作
spss图形
DBSCAN算法
基于密度的聚类方法
优缺点
聚类和分类的区别:分类已知类别 聚类未知
K-means算法
评价该算法
优点
- 算法简单、快速
- 对处理大数据集,该算法相对效率高
缺点
- 要求用户事先选定蔟的数目K
- 对初值敏感
- 对于孤立点数据敏感
K-means++算法可以处理上述的缺点2 3
K-means++算法
基本原则:初始的聚类中心之间的相互距离要尽可能的远
系统(层次)聚类
绝对值距离:使用网状距离
类与类之间的距离
操作
spss图形
DBSCAN算法
基于密度的聚类方法