DM
文章平均质量分 66
数据挖掘啦
史努比doge
这个作者很懒,什么都没留下…
展开
-
数据挖掘概览
数据挖掘(Data Mining)就是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程.原创 2024-06-24 20:49:08 · 412 阅读 · 0 评论 -
数据挖掘常见算法(聚类)
K-均值算法(K-means算法)方法:首先选择K个随机的点,称为聚类中心.对于数据集中的,每一个数据,按照距离K个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类PAM(k-中心点算法算法分析:k-中心点算法消除了k-平均算法对孤立点的敏感性;比k-平均算法更健壮。算法分析:k-中心点算法消除了k-平均算法对孤立点的敏感性;比k-平均算法更健壮。原创 2024-06-24 20:47:52 · 515 阅读 · 0 评论 -
数据挖掘常见算法(关联)
采用分而治之的基本思想,将数据库中的频繁项集压缩到一棵频繁模式树中,同时保持项集之间的关联关系。然后将这棵压缩后的频繁模式树分成一些条件子树,每个条件子树对应一个频繁项,从而获得频繁项集,最后进行关联规则挖掘。比如展开定量关联规则、泛化关联规则及周期性的关联规则的研究。Apriori算法,但它并不能保证高效率,它的效率依赖于数据集。算法基于频繁项集性质的先验知识,使用由下至上逐层搜索的迭代方法,即从频繁。项集,直到不能找到包含更多项的频繁项集为止。还需要其他的开销,需要存储空间更大,使用。原创 2024-06-24 19:06:29 · 483 阅读 · 0 评论 -
数据挖掘常见算法(分类算法)
分类算法原创 2024-06-24 16:41:30 · 1153 阅读 · 0 评论