DMQL应该包括对以下任务的指定:
1、说明数据库的部分或用户感兴趣的数据集
2、要挖掘的知识类型
3、用于指导挖掘的背景知识
4、模式评估、兴趣度量
5、如何显示发现的知识
下面对第2、3简单说明
2、要挖掘的知识类型将决定所使用的数据挖掘功能。
几种主要的数据挖掘功能
功能名称 | 描述 |
特征化 | 目标数据的一般特征或特性汇总 |
数据区分 | 将目标对象的一般特征与一个或多个对比类对象的特征相比较 |
关联分析 | 发现关联规则,这些规则展示属性一值频繁的在给定数据中集中一起出现的条件 |
分类 | 找出区分数据类或概念的模型(或函数),以便用之标志位置的对象类 |
以及聚类分析、孤立点分析、演变分析......
3、用于指导挖掘的相关的背景知识
背景知识的表达一个最重要的方式是概念分层。每个属性或维可能有多个概念分层,已适应用户从不同角度看待问题的需要