![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
小木屑
这个作者很懒,什么都没留下…
展开
-
DMQL
DMQL应该包括对以下任务的指定:1、说明数据库的部分或用户感兴趣的数据集2、要挖掘的知识类型3、用于指导挖掘的背景知识4、模式评估、兴趣度量5、如何显示发现的知识下面对第2、3简单说明 2、要挖掘的知识类型将决定所使用的数据挖掘功能。 几种主要的数据挖掘功能功能名称描述特征化目标数据的一般特征或特性原创 2014-03-31 21:51:20 · 1567 阅读 · 0 评论 -
特征化量化规则和类比较量化规则
1. 特征化量化规则2. 3. 所谓量化规则指的是每一种不同模式占当前模式总量的百分比。4. 例如: 5. 说明:如果销售的商品时计算机,则销售地点为亚洲的比重占25%,销售地点为南美的比重占45%(该规则表达的是必要条件) 类区分(类比较)量化规则 这一种是由条件推导出类,例子的解释为:对于出生地为加拿大,年龄原创 2014-04-02 12:36:24 · 1978 阅读 · 0 评论 -
完全立方体计算的多路数组聚集(MultiWay)
看数据挖掘书的时候,遇到该算法,郁闷了好几天终于搞明白了,现在分享一下自己的理解。这里只解释一下3-D数组中2-D数组的计算,3-D数组的图可以参照《数据挖掘概念与技术(韩家炜)》中的数据立方体中的图。 多路数组聚集算法,该算法的思想是(也算是最后的结论):“将最小的平面放在内存中,对最大的平面每次只是取并计算一块”。 该算法的核心是:“用一个二维数组缓存一个2-D原创 2014-03-22 15:42:01 · 3175 阅读 · 1 评论 -
Apriori算法和FP-树算法
Apriori算法Ariori算法利用频繁项集性质的先验知识(prior knowledge),通过逐层搜索的迭代方法,即将K-项集用于探查(k+1)-项集,来穷尽数据集中的所有频繁项集。先找到频繁1-项集集合L1,然后用L1找到频繁2-项集集合L2,接着用L2找到L3,知道找不到频繁K-项集,找每个频繁项集需要一次数据库扫面。Apriori性质:频繁项集的所有非空子集也必须是频繁的。原创 2014-04-03 16:08:12 · 2240 阅读 · 0 评论 -
强关联规则是否都是有趣的?
挖掘了关联规则后,哪些规则是用户感兴趣的?强关联规则是否就是原创 2014-04-04 16:33:43 · 4950 阅读 · 0 评论 -
K-Means算法Java实现
K-Means算法作为很简单的聚类算法,但是应用很广泛。关于K-Means算法理论讲解请参照 算法杂货铺——k均值聚类(K-means) 这篇文章,该文章讲解的非常到位。下面仅给出算法的Java实现,网上的实现有很多,但有很多都没有给出测试数据,很是不好。import java.io.BufferedReader;import java.io.BufferedWriter;impo原创 2015-07-05 14:55:30 · 1087 阅读 · 0 评论