- 数据挖掘系统的成功离不开人工的指导和干预
- 概念分层的下钻操作使用较低层概念代替较高层概念,从而使用户能够对过于一般化的数据做更详细分析
- 要挖掘的知识类型将决定所使用的数据挖掘工具
- 为了方便用户在不同概念层观察发现的模式,可以使用上卷、下钻、添加或删除属性等操作。
- 兴趣度的度量包括置信度、支持度、噪声和新颖度等度量
- 在同一个维上,可能根据用户的观点不同,存在多个概念分层
- 常用的四种兴趣度的度量包括简单性、确定性、实用性、新颖性
- 任务相关数据说明应包括:关于检索数据的排序和分组指令、相关的表名或数据立方体的名字、探察的相关属性或维、包含相关数据的数据库或数据仓库
- 没有精确的指令和规则,数据挖掘系统就没法使用
- 一个好的系统体系结构,可以使数据挖掘系统在性能、可交互性、可使用性以及可扩展性等多方面都得到良好的保护
- 在概念分层中应用上卷操作,使得用户可以使用较高层次概念替代较低层次概念
- 用户感兴趣的只是数据库或数据仓库的一个子集
- 概念分层是背景知识的一种,它允许在多个抽象层上发现知识。
- 数据挖掘原语应该包括以下:
如何显示发现的知识
要挖掘的知识类型
用于指导挖掘的背景知识
模式评估、兴趣度量