![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 86
全是头发的羊羊羊
学术裁缝在线缝缝补补
展开
-
数据挖掘(作业4--异常值检测
异常检测方法通常可分为使用参数的方法和基于距离的方法。原创 2024-03-13 21:47:52 · 1194 阅读 · 0 评论 -
层次聚类(学习笔记
Ward方法是一种层次聚类算法中使用的一种合并策略,它旨在最小化合并后的群集的方差增加量。在层次聚类中,通过将最相似的群集合并来构建一棵树状结构,最终形成一个完整的聚类结果。该方法在某些情况下能够产生更均衡和更紧凑的聚类结果,尤其适用于聚类数量较少、群集大小差异较大或群集之间差异较大的情况。它倾向于形成均衡的群集,对于较大的数据集也相对高效。在这种方法中,两个群集之间的距离被定义为一个群集中的每个点与另一个群集中的每个点之间的。在全链接方法中,两个群集之间的距离定义为一个群集中的最远成员与另一个群集中的。原创 2023-12-23 13:28:21 · 456 阅读 · 0 评论 -
数据挖掘学习笔记
协方差(covariance)和相关性(correlation)都是用来描述两个随机变量之间的关系的统计概念。原创 2023-10-31 22:39:31 · 527 阅读 · 1 评论 -
数据挖掘--聚类
聚类原创 2023-12-10 11:44:36 · 936 阅读 · 1 评论